Показать сообщение отдельно
  #7 (permalink)  
Старый 02.09.2017, 06:08
Профессор
Отправить личное сообщение для laimas Посмотреть профиль Найти все сообщения от laimas
 
Регистрация: 14.01.2015
Сообщений: 12,990

Вам чего надо и причем C#? На вопрос как можно понять, что параллельные строки это документ без распознавания символов ответом было "не надо". Теперь же речь пошла об этом.

В вашем случае, это документ?

┌┐└┘□ⱡffl꜡ⱬ●●●●●●● ●
┌┐└┘□ⱡffl꜡ⱬ●●●●●●● ●

Возьмем простую, на первый взгляд, задачу - обрезать белые кромки у фото. Казалось бы все просто - в градациях серого работает в HSB модели. Так как цвет кромок не обязательно белый, особенно если JPEG, то задав некий порог, проверяя его находим равное и большее этого порога и удаляем.

При этом не нужно сканировать всю строку по ширине, проверяем только верхние/нижние, левые/правые центральные точки на каждой стороне начиная от кромки изображения.

Было бы быстро. А что если на фото ночное небо, сверху видим край луны, некоторые звезды находятся также не границе раздела, ну и прочие возможные "артефакты"? В этом случае без анализа соседних точек можно удалить и полезное, то есть придется анализировать строку полностью.

Если говорить о С# и писать приложение, то нафик он нужен браузер, можно и полноценное ПО написать, и если есть возможность использовать библиотеку какой либо OCR вот тогда можно гарантировать с большой вероятностью, что получен документ.
Ответить с цитированием