logo
итт все лекции

Ocr cuneiform

OCR CuneiForm  – это бесплатная программа сканирования и распознавания текста российского разработчика Cognitive Technologies. Первоначально OCR CuneiForm разрабатывался как коммерческий продукт, однако, в декабре 2007 года компания-разработчик стала распространять программу бесплатно, а в апреле 2008 года открыла исходные тексты программы. В планах дальнейшее развитие этой системы распознавания текста – проект OpenOcr.Org, поддерживаемый компанией Cognitive Technologies и сообществом OpenSource разработчиков.

Эта OCR-программа прилагается в комплекте с некоторыми моделями сканеров фирм Canon, Hewlett Packard, Oki, Olivetti. Технологии распознавания компании Cognitive используются в популярном издательском пакете Corel Draw.

OCR CuneiForm (рис. 9) обеспечивает быстрое, удобное и качественное распознавание текста с сохранением исходного вида документа. Поддерживается распознавание с более 20 языков, среди них русский, украинский, английский, немецкий, французский, испанский, итальянский, португальский, шведский, финский, сербский, хорватский, польский, а также распознавание смешанного русско-английского текста.

OCR CuneiForm  имеет следующие основные возможности:

             современный и интуитивно-понятный интерфейс, встроенные помощники для сканирования и распознавания текста;

             встроенный текстовый редактор и система контроля правописания для работы с распознанным текстом;

             распознавание текста с сохранением исходного вида документа;

             распознавание таблиц со сложной структурой, многоколоночного текста;

             сохранение черно-белых и цветных иллюстраций в распознанном документе;

             поддерживаются все TWAIN-совместимые сканеры;

             использование современных разработок, таких как нейронные сети, адаптивное распознавание символов, когнитивный анализ и другие;

             распознавание печатных шрифтов из книг, журналов, газеты, текстов из пишущих машинок, распечаток из матричных и лазерных принтеров и т.п.;

             режимы автоматического, полуавтоматического и ручного разбиения на блоки для поиска в документе текстовых фрагментов, рисунков и таблиц;

             дополнительные возможности, повышающие удобство работы с программой.