logo
Интеллектуальные Информационные Системы / лекции

4.2. Основы теории анализа и распознавания изображений.

Пусть дано множество M объектов ; на этом множестве существует разбиение на конечное число подмножеств (классов) Ω, i = {1,m},M = Ωi (i = 1..m) . Объекты ω задаются значениями некоторых признаков xj, j= {1,N} . Описание объектаI(ω)=(x1(ω), ..., xN(ω)) называют стандартным, если xj(ω) принимает значение из множества допустимых значений.

Пусть задана таблица обучения (таблица 4.1). Задача распознавания состоит в том, чтобы для заданного объекта ω и набора классов Ω1, ..., Ωm по обучающей информации в таблице обучения I01...Ωm) о классах и описанию I(ω) вычислить предикаты:

Pi(ω Ωi)={1(ω Ωi), 0(ω Ωi), (ω Ωi)},

где i= {1,m} , Δ - неизвестно.

Таблица 4.1. Таблица обучения

Объект

Признаки и их значения

Класс

x1

xj

xn

ω1

11

1j

1n

Ω1

...

ωr1

r11

r1j

r1n

...

ωrk

rk1

rkj

rkn

Ωm

...

ωrm

rm1

rmj

rmn

Рассмотрим алгоритмы распознавания, основанные на вычислении оценок. В их основе лежит принцип прецедентности (в аналогичных ситуациях следует действовать аналогично).

Пусть задан полный набор признаков x1, ..., xN. Выделим систему подмножеств множества признаков S1, ..., Sk. Удалим произвольный набор признаков из строк ω1, ω2, ..., ωrm и обозначим полученные строки через Sω1, Sω2, ..., Sωrm, Sω' .

Правило близости, позволяющее оценить похожесть строк Sω' и Sωr состоит в следующем. Пусть "усеченные" строки содержат q первых символов, то есть Sωr=(a1, ..., aq) и Sω'=(b1, ..., bq) . Заданы пороги ε1...εq, . Строки Sωr и Sω' считаются похожими, если выполняется не менее чем неравенств вида

|aj-bj| εj, j=1,2,..., q.

Величины ε1...εq, входят в качестве параметров в модель класса алгоритмов на основе оценок.

Пусть Гi(ω') - оценка объекта ω' по классу Ωi.

Описания объектов {ω'}, предъявленные для распознавания, переводятся в числовую матрицу оценок. Решение о том, к какому классу отнести объект, выносится на основе вычисления степени сходства распознавания объекта (строки) со строками, принадлежность которых к заданным классам известна.

Проиллюстрируем описанный алгоритм распознавания на примере. Задано 10 классов объектов (рис. 4.2а). Требуется определить признаки таблицы обучения, пороги и построить оценки близости для классов объектов, показанных на рис. 4.2б. Предлагаются следующие признаки таблицы обучения:

x1- количество вертикальных линий минимального размера;

x2- количество горизонтальных линий;

x3- количество наклонных линий;

x4- количество горизонтальных линий снизу объекта.

Рис. 4.2.  Пример задачи по распознаванию

На рис. 4.3 приведена таблица обучения и пороги

ε1=1, ε2=1, ε3=1, ε4=1, =1.

Из этой таблицы видно, что неразличимость символов 6 и 9 привела к необходимости ввода еще одного признака x4.

Рис. 4.3.  Таблица обучения для задачи по распознаванию

Теперь может быть построена таблица распознавания для объектов на рис. 4.2б.

Объект

Объект 1

Объект 2

Объект 3

Объект 4

x1

1

3

4

4

x2

2

3

1

2

x3

1

0

0

0

x4

1

1

Результат распознавания

Цифра 2

Цифра 8 или 5

Читателю предлагается самостоятельно ответить на вопрос: что будет, если увеличить пороги ε1, ε2, ε3, ε4, ? Как изменится качество распознавания в данной задаче?

Заключая данный раздел лекции, отметим важную мысль, высказанную А. Шамисом в работе [55]: качество распознавания во многом зависит от того, насколько удачно создан алфавит признаков, придуманный разработчиками системы. Поэтому признаки должны быть инвариантны к ориентации, размеру и вариациям формы объектов.