Поиск в файле изображения листа А4
Надо сделать кнопу загрузить, после загрузки файла с картинкой проанализировать есть ли на ней белые поля от листа А4, т.е. Там фото документа или копии документа. Плюс поиск на картинке двух длинных параллельных строк с буквоцифрами. Распознавание не требуется. Решение нужно мультибраузерное и мультиплатформенное( в идеале и для десктопа и для мобильной версии) . За качественную и красивую работу и вознаграждение соответствующее.
|
Цитата:
|
Цитата:
|
Цитата:
Все остальное без анализа вилами писано. Чтобы понять "две параллельные линии", что есть текст в две строки, надо потрудится или можно просто получить липу. |
https://youtu.be/ND54_m1Vs8U
вот как работает со стримом. работает только в браузере хром в нативном клиенте. половина кода на c# половина на js. после включения камеры ищется параллельные строки, затем робот пытается разбить их на символы. если более определенного провента символос видно, то делается фото , обрезается вокруг желтого прямоугольника, монохромится, и по websocket кусок отправляется ко мне на сервер распознавания. откуда возвращается json, который потом заполняет форму. так же ищется фото лица (зеленый жирный квадратик). в данном случае лицо нашлось где-то в другом месте. т.к. копия плохая. надо на js повторить логику поиска нижних строк и анализа на наличие там символов. только не для стрима, а для одной загруженной фотографии. websocket в мобильных браузерах не работает, потому post-get запросом отправлять. |
к сожалению не откликается кудесник, который имеет опыт работы с изображениями в js и html5, а могли бы иногда обменивать знания на деньги. заданий разноплановых с изображениями - масса.
|
Вам чего надо и причем C#? На вопрос как можно понять, что параллельные строки это документ без распознавания символов ответом было "не надо". Теперь же речь пошла об этом.
В вашем случае, это документ? ┌┐└┘□ⱡffl꜡ⱬ●●●●●●● ● ┌┐└┘□ⱡffl꜡ⱬ●●●●●●● ● Возьмем простую, на первый взгляд, задачу - обрезать белые кромки у фото. Казалось бы все просто - в градациях серого работает в HSB модели. Так как цвет кромок не обязательно белый, особенно если JPEG, то задав некий порог, проверяя его находим равное и большее этого порога и удаляем. При этом не нужно сканировать всю строку по ширине, проверяем только верхние/нижние, левые/правые центральные точки на каждой стороне начиная от кромки изображения. Было бы быстро. А что если на фото ночное небо, сверху видим край луны, некоторые звезды находятся также не границе раздела, ну и прочие возможные "артефакты"? В этом случае без анализа соседних точек можно удалить и полезное, то есть придется анализировать строку полностью. Если говорить о С# и писать приложение, то нафик он нужен браузер, можно и полноценное ПО написать, и если есть возможность использовать библиотеку какой либо OCR вот тогда можно гарантировать с большой вероятностью, что получен документ. |
Вам чего надо и причем тут C#? На вопрос как можно понять, что параллельные строки это документ без распознавания символов ответом было "не надо". Теперь же речь пошла об этом.
В вашем случае, это документ? ┌┐└┘□ⱡffl꜡ⱬ●●●●●●● ● ┌┐└┘□ⱡffl꜡ⱬ●●●●●●● ● Возьмем простую, на первый взгляд, задачу - обрезать белые кромки у фото. Казалось бы все просто - в градациях серого работает в HSB модели. Так как цвет кромок не обязательно белый, особенно если JPEG, то задав некий порог, проверяя его находим равное и большее этого порога и удаляем. При этом не нужно сканировать всю строку по ширине, проверяем только верхние/нижние, левые/правые центральные точки на каждой стороне начиная от кромки изображения. Было бы быстро. А что если на фото ночное небо, сверху видим край луны, некоторые звезды находятся также не границе раздела, ну и прочие возможные "артефакты"? В этом случае без анализа соседних точек можно удалить и полезное, то есть придется анализировать строку полностью. Если говорить о С# и писать приложение, то нафик он нужен браузер, можно и полноценное ПО написать, и если есть возможность использовать библиотеку какой либо OCR вот тогда можно гарантировать с большой вероятностью, что получен документ. |
Цитата:
Цитата:
Цитата:
|
Цитата:
|
Часовой пояс GMT +3, время: 16:17. |