Шпоры автоматизация и моделирование в ИД Сулим

39. Методы распознавания и способы считывания знаков: процесс распознавания, задачи распознавания

Распознавание представляет собой процесс преобразования входной информации по некоторым параметрам, в результате распознаваемая информация относится к какому-либо классу.

Основные задачи распознавания.

1. определение полного перечня признаков представленной информации. К детерминированным относятся конкретные числовые значения. К вероятностным относятся, например, признаки знаков рукописного написания. Логические – это признаки, которые могут принимать два взаимоисключающих значения. Структурные признаки представляют набор, цепочку элементов (терминалов) структуры, так, например, всякое слово имеет набор знаков, знак – набор линий или примитивов.

2. классификация распознанной информации. Для этого разрабатываются рабочие алфавиты классов и признаков. Одна из ключевых задач – выбор алгоритмов распознавания, позволяющих отнести распознаваемую информацию к тому или другому классу.

Задача распознавания стилизованных символов основана на сравнении стилизованных шрифтов с эталонами. Распознавания типографского и особенно рукописного сложнее.

Метод зондов. Состоит в том, что на рецепторном поле при распознавании изображения знака располагаются зонды, которые воспринимают сигналы, пропорциональные коэффициенту отражения света от элементов знака. Каждому знаку соответствует определенная комбинация освещенных зондов.

Свое развитие метод зондов получил в методе фрагментов, который заключается в следующем. Все распознаваемые одинаково ориентируемые символы накладываются друг на друга, и при этом окажется, что одни области поля изображения всегда будут темными, другие – светлыми, а третья часть областей для одних знаков будет темной, для других – светлой. Эта часть и несет информацию о распознавании знаков и наз. фрагментами поля изображения. Кодовое описание этих фрагментов должно однозначно соответствовать каждому распознаваемому символу.

Матричный метод. Главной особенностью матричных методов является представление печатных символов в виде нормированных матриц, элементы которых определяются совокупностью темных и светлых точек, на которые разбивается изображение. Распознавание символа происходит путем сравнения матрицы считываемого символа с матрицами-эталонами всего алфавита.

Корреляционный метод. Разновидность матричного. Он обычно применяется для распознавания знаков машинописных и типографских текстов, например, в читающих автоматах. Первый вариант. Процедура распознавания неизвестного символа S сводится к определению коэффициента r корреляции изображения этого символа с каждым эталонным символом в соответствии с формулой. Второй вариант предусматривает разбиение знака на фрагменты и для фрагментов изображения рассчитывается несколько автокорреляционных функций со сдвигом плоскостей изображения друг относительно друга в нескольких произвольных направлениях, в результате чего получается, так называемое, морфологическое автокорреляционное преобразование (МАП). После чего производится сравнение МАП с эталонным МАП.

Квазитопологический метод, основанный на анализе топологической структуры знаков: мест начала и конца линий, разветвление линий, изменение направления и длины линий, изломов и соединений. Достоинством указанного метода является независимость от начертания букв. Однако необходимо вводить для некоторых знаков дополнительные признаки, которые позволили бы различать буквы П, Л, С, Г, а также отличать цифры 6 и 9.

Содержание