Показать сообщение отдельно
  #9 (permalink)  
Старый 02.09.2017, 09:47
Интересующийся
Отправить личное сообщение для valdur2000 Посмотреть профиль Найти все сообщения от valdur2000
 
Регистрация: 14.11.2013
Сообщений: 10

Сообщение от laimas Посмотреть сообщение
Вам чего надо и причем тут C#? На вопрос как можно понять, что параллельные строки это документ без распознавания символов ответом было "не надо". Теперь же речь пошла об этом.

В вашем случае, это документ?

┌┐└┘□ⱡffl꜡ⱬ●●●●●●● ●
┌┐└┘□ⱡffl꜡ⱬ●●●●●●● ●
по-мне такая строка тоже документ. есть сервер с библиотекой распознавания , куда потом данные пойдут и она сама все там поймет, но хочется сократить кол-во спама и траффик. не до нуля, но в разумных пределах. хотя конечно распознавание количества символов в строке - тоже интересно..

Сообщение от laimas Посмотреть сообщение
Возьмем простую, на первый взгляд, задачу - обрезать белые кромки у фото. Казалось бы все просто - в градациях серого работает в HSB модели. Так как цвет кромок не обязательно белый, особенно если JPEG, то задав некий порог, проверяя его находим равное и большее этого порога и удаляем.

При этом не нужно сканировать всю строку по ширине, проверяем только верхние/нижние, левые/правые центральные точки на каждой стороне начиная от кромки изображения.

Было бы быстро. А что если на фото ночное небо, сверху видим край луны, некоторые звезды находятся также не границе раздела, ну и прочие возможные "артефакты"? В этом случае без анализа соседних точек можно удалить и полезное, то есть придется анализировать строку полностью.
Я бы может какими-то квадратиками анализировал, которые рядом стоят. по-моему мнению типов копии может быть 5
  • копия на весь экран, тут наверное и не поймешь
  • копия в напр правом нужнем углу дока - тогда поля вокруг будут буквой Г
  • копия впритык к стороне, напр низ может быть с полями П
  • копия в середине листа, когда поля будут вокруг. типа О
  • разное сочетание предыдущих.
экспертного супер робота можно создавать, но вот насколько трудоемко и денежнозатратно... по-мне определять , что на фотке есть поля типа Г,П,О - это уже работоспособная логика. но я не программист, может есть более надежные способы видящие зорче.


Сообщение от laimas Посмотреть сообщение
Если говорить о С# и писать приложение, то нафик он нужен браузер, можно и полноценное ПО написать, и если есть возможность использовать библиотеку какой либо OCR вот тогда можно гарантировать с большой вероятностью, что получен документ.
это все есть и работает. задача на стороне клиента уменьшать спам и траффик грузящий основной сервер.
Ответить с цитированием