logo
МИРЭА / Методичка_2010 / Методичка_2010

Уровни и методы машинного зрения

На протяжении десяти-пятнадцати последних лет в алгоритмическом аспекте последовательность действий по обработке изображения принято рассматривать в согласии с, так называемой модульной парадигмой [30]. Эта парадигма, предложенная Д. Марром на основе длительного изучения механизмов зрительного восприятия человека, утверждает, что обработка изображений должна опираться на несколько последовательных уровней восходящей информационной линии: от «иконического» представления объектов (растровое изображение, неструктурированная информация) – к их символическому представлению (векторные и атрибутивные данные в структурированной форме, реляционные структуры и т.п.). Исходя из этого, в области машинного зрения принято выделять следующие основные этапы обработки данных:

Связанные с этими этапами уровни обработки обычно называются соответственно: обработка нижнего уровня, среднего уровня, высокого уровня. В то время как алгоритмы обработки нижнего уровня (фильтрация простых шумов, гистограммная обработка) могут рассматриваться как хорошо проработанные и детально изученные, алгоритмы среднего уровня (сегментация) продолжают сегодня оставаться центральным полем приложения инженерных и исследовательских усилий. За последние годы значительный прогресс был достигнут по отношению к проблемам сопоставления точек и фрагментов изображений (matching) [176], [242], выделения признаков внутри малых фрагментов [172], [215] [226], высокой точности 3D-позиционирования точек [175], [178], что подразумевает соответствующее моделирование и калибровку датчиков и их комбинаций, выделение простых яркостно-геометрических структур типа «точка», «край», «пятно», «прямая линия», «угол» [135], [136], [204], [215], [238].

Методы обработки высокого уровня, относящиеся собственно к «пониманию изображений», по-прежнему представляют собой «вызов» для сообщества исследователей в области компьютерного зрения и искусственного интеллекта. Безусловно, перспектива создания будущих поколений «интеллектуальных машин» в основном зависит от дальнейшей разработки именно этого круга алгоритмов.

В настоящее время известно несколько основных алгоритмических подходов и математических формализмов, используемых при разработке практических систем анализа изображений. Это гистограммные преобразования, анализ проекций, линейная и нелинейная фильтрация изображений, яркостная и текстурная сегментация, корреляционное обнаружение и согласованная фильтрация, морфологический подход Ю.П. Пытьева, математическая морфология Серра, метод «нормализации фона», преобразование Хафа, структурно-лингвистический подход и ряд других. Большинство этих методов будут рассмотрены в данной книге.

Значительный вклад в разработку методов и алгоритмов обработки изображений и машинного зрения внесли работы М.П.Ярославского, П.А.Бакута, В.К.Злобина, В.К.Баклицкого, В.Г.Лабунца, В.Л.Левшина, Ю.П.Пытьева, Серра, Р.Харалика, Е.Дэвиса, У.Гренандера, К.Ту и многие другие. За последние десятилетия создано множество успешных систем машинного зрения, в которых в тех или иных сочетаниях реализованы упомянутые подходы и парадигмы. Однако единого математического формализма и единой общепризнанной методики разработки алгоритмов анализа изображений по-прежнему не существует, и, следовательно, наука об обработке изображений все еще находится в развитии, переживая период роста, чреватый возможностью появления в любой момент новых самых неожиданных и революционных методик и теорий.