4.3. Актуальные задачи распознавания
Среди множества интересных задач по распознаванию (распознавание отпечатков пальцев, распознавание по радужной оболочке глаза, распознавание машиностроительных чертежей и т. д.) следует выделить задачу определения реальных координат заготовки и определения шероховатости обрабатываемой поверхности , рассмотренную в лекции 10. Другой актуальной задачей является распознавание машинописных и рукописных текстов в силу ее повседневной необходимости. Практическое значение задачи машинного чтения печатных и рукописных текстов определяется необходимостью представления, хранения и использования в электронном виде огромного количества накопленной и вновь создающейся текстовой информации. Кроме того, большое значение имеет оперативный ввод в информационные и управляющие системы информации с машиночитаемых бланков, содержащих как напечатанные, так и рукописные тексты. В связи с этим рассмотрим принципы и подход к распознаванию в задаче машинного чтения печатных и рукописных текстов, описанные в работе [55].Для решения данной задачи используются следующие основные принципы.
Принцип целостности - распознаваемый объект рассматривается как единое целое, состоящее из структурных частей, связанных между собой пространственными отношениями.
Принцип двунаправленности - создание модели ведется от изображения к модели и от модели к изображению.
Принцип предвидения заключается в формировании гипотезы о содержании изображения. Гипотеза возникает при взаимодействии процесса "сверху-вниз", разворачивающегося на основе модели среды, модели текущей ситуации и текущего результата восприятия, и процесса "снизу-вверх", основанного на непосредственном грубом признаковом восприятии.
Принцип целенаправленности, включающий сегментацию изображения и совместную интерпретацию его частей.
Принцип "не навреди" - ничего не делать до распознавания и вне распознавания, то есть без "понимания".
Принцип максимального использования модели проблемной среды.
Указанные принципы реализованы в пакете программ "Графит" [56], в программах FineReader-рукопись и FormReader - для распознавания рукописных символов и, частично, в программе FineReader для распознавания печатных текстов [55]. Входящая в FormReader программа чтения рукописных текстов была выпущена в 1998 году одновременно с системой ABBYY FineReader 4.0. Эта программа может читать все рукописные строчные и заглавные символы, допускает ограниченные соприкосновения символов между собой и с графическими линиями и обеспечивает поддержку 10 языков. Основное применение программы - распознавание и ввод информации с машиночитаемых бланков.В системе ABBYY FormReader при распознавании рукописных текстов используются структурный, растровый, признаковый, дифференциальный и лингвистический уровни распознавания. Для более подробного освоения подходов к распознаванию машинописных и рукописных текстов в системе ABBYY FormReader читателю рекомендуется непосредственно ознакомиться с работой А. Шамиса [55], при этом знание основ машинной графики на уровне [57] подразумевается.С другими работами по распознаванию читатель может познакомиться в литературе [62], [63].Завершая этот раздел лекции, отметим особенности задачи зрительного восприятия роботов по сравнению с традиционными задачами распознавания образов и машинной обработки изображений [64]:
необходимость построения комплексного описания среды на основе учета значительной априорной информации (модели проблемной среды) в отличиие от традиционной задачи выделения фиксированных признаков или измерения отдельных параметров;
необходимость анализа трехмерных сцен не только в плане анализа трехмерных объектов по их плоским проекциям, но и в плане определения объемных пространственных отношений;
необходимость анализа изображений, включающих одновременно несколько произвольно расположенных объектов (в общем случае произвольной формы) в отличие от традиционной задачи, когда для распознавания предъявляется, как правило, один объект;
необходимость анализировать реальную динамическую среду, а не статические изображения;
отсутствие постоянной фиксированной задачи и необходимость оперативно решать возникающие по ходу дела задачи;
необходимость следить за изменениями в среде, которые могут порождать новые оперативные задачи;
необходимость организации системного процесса взаимодействия в реальном времени нескольких подсистем робота ("глаз-мозг", "глаз-мозг-рука").
В заключение лекции следует отметить, что методов распознавания много, они опубликованы (см. список литературы к данной лекции). Успеха в создании серьезных программных продуктов по распознаванию и решению задач зрительного восприятия роботов добьются коллективы, упорно и кропотливо создающие и оттачивающие свои инструментальные средства для реальных задач распознавания изображений.
- Интеллектуальные информационные системы
- 230201 - Информационные системы и технологии
- 080801 - Прикладная информатика в экономике
- Оглавление
- 1. Введение в интеллектуальные информационные системы
- 1.1. Предмет исследования искусственного интеллекта
- 1.2. Определение иис
- 1.3. Искусственный интеллект и интеллектуальное поведение
- 1.4. Определения, используемые в дисциплине иис
- 1.5. Исторический обзор работ в области ии
- Доказательство теорем.
- Распознавание изображений.
- Экспертные системы.
- Машинный перевод и понимание текстов на естественном языке.
- Игровые программы.
- Машинное творчество.
- 1.6. Кратко о развитии робототехники
- 1.7. Области коммерческого использования искусственного интеллекта
- 1.8. Иис других типов
- 1.9. Интеллектуальные агенты
- 1.10. Примеры иис
- 2. Системы представления знаний
- 2.1. Фреймы
- 2.2. Исчисления предикатов
- 2.3. Системы продукций
- 2.4. Семантические сети
- 2.5. Нечеткая логика
- 3. Методы поиска решений
- 3.1. Методы поиска решений в пространстве
- 3.2. Алгоритмы эвристического поиска
- Алгоритм наискорейшего спуска по дереву решений
- Алгоритм оценочных (штрафных) функций
- Алгоритм минимакса
- Альфа-бета-процедура
- 3.3. Методы поиска решений на основе исчисления предикатов
- 3.4. Задачи планирования последовательности действий
- 3.5. Поиск решений в системах продукций
- 4. Распознавание изображений
- 4.1. Общая характеристика задач распознавания образов и их типы.
- 4.2. Основы теории анализа и распознавания изображений.
- 4.2. Распознавание по методу аналогий.
- 4.3. Актуальные задачи распознавания
- 5. Общение с эвм на естественном языке. Системы речевого общения
- 5.1. Проблемы понимания естественного языка
- 5.2. Анализ текстов на естественном языке
- Морфологический анализ
- Синтаксический анализ
- Семантическая интерпретация
- Проблемный анализ
- 5.3. Системы речевого общения
- 6. Методология построения экспертных систем
- 6.1. Экспертные системы: Определения
- 6.2. Основные компоненты эс
- 6.3. Типы решаемых задач эс:
- 6.4. Ограничения и недостатки эс:
- 6.5. Обобщенная схема эс
- 6.6. Экспертные системы: классификация
- 6.7. Трудности при разработке экспертных систем
- 6.8. Методология построения экспертных систем
- 6.9. Примеры экспертных систем
- 7. Практическая разработка экспертных систем в среде clips
- 7.1 Постановка задачи
- 7.2. Основы программирования в системе clips
- 7.3. Программирование в clips экспертной системы управления технологическим процессом