LINUX.ORG.RU

OCR: сегментация текста.


0

0

Я понимаю, конечно, что вопрос не сюда, но всё же... Может кто кинет ссылками на ПОДРОБНОЕ описание алгоритмов сегментации(выделения) текста для OCR. Особенно интересны алгоритмы, основанные на анализе profile prjection.

P.S. http://ocr.apmath.spbu.ru прочитал давным-давно..


>P.S. http://ocr.apmath.spbu.ru прочитал давным-давно..

И повидимому ничего не понял

ето самый простой етап в OCR так что подумай есть ли смысл вообще браться за дело.

А вообще берёш учебник по Численным Методам и по Интегральным Преобразованиям (Спектральному Анализу) и внимательно читаеш. Если не понимаеш чё там написано то бросай дело всёравно ничего хорошего с тябя не выйдеть. Иначе закончив чтение будешь знать перед кем ответ держать.

ЗЫ можешь попытаться заюзать готовые проекты

cvv ★★★★★
()

Есть открытая библиотека OpenCV, там сегментация просто картинок есть, наверно для текста аналогично..

dilmah ★★★★★
()
Ответ на: комментарий от cvv

Уважаемый Виталий! На вашем месте я бы не был столь категоричен: задача сегментации текста является достаточно сложной и, как это не странно, единственно верного способа ее решения не существует. Об этом, кстати, косвенно свидетельствует количество научных работ, посвященных этой проблеме.

Что касается http://ocr.apmath.spbu.ru, то мне почему-то кажется, что ребята взяли готовые алгоритмы и приписали их авторство себе, но это моё личное мнение.

syomin
() автор топика
Ответ на: комментарий от syomin

>Уважаемый Виталий! На вашем месте я бы не был столь категоричен: задача сегментации текста является достаточно сложной и, как это не странно, единственно верного способа ее решения не существует. Об этом, кстати, косвенно свидетельствует количество научных работ, посвященных этой проблеме.

;-)

Я говорю об относительной а не абсолютной сложности.

Да ета задача существенно сложнее чем скажем задача поворота растрового рисунка на произвольный угол НО задача распознания выделенного символа ещё на порядок сложнее чем само выделение.

>и, как это не странно, единственно верного способа ее решения не существует.

ничего здеся странного. так оно и должно быть. для решения етого етапа мы имеем вместо одного оптимального несколько приближённых алгоритмов. собственно для етапа распознавания оптимальный алгоритм для определённых начальных условий существует описан опубликован. Здеся мы имеем проблемы в его реализации.

cvv ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.