Mylnik_ISU / Мыльник_Исследование систем управления_2001

11.4 Математические методы распознавания

С целью обеспечения высокой эффективности сложных, больших систем распознавания наряду с теоретическими исследованиями применяют математическое или (и) физико-математическое моделирование. Например, при построении локационных систем селекции и распознавания разрабатывается комплекс математических моделей, являющийся инструментом для организации исследований на основе выполнения математических экспериментов [7]. Физико-математическое моделирование предусматривает сочетание физических (лабораторных, натурных) и математических экспериментов. При этом, как отмечено в [7], роль математического эксперимента значительнее при лабораторных исследованиях, чем при натурных испытаниях. При разработке большой системы распознавания и ее элементов может реализовываться следующая цепочка: физико-математические исследования - натурные испытания.

Решение задач, возникающих при разработке и эксплуатации распознающих систем, осуществляется с применением математики. Так, для обработки априорной информации логического характера применяется алгебра логики, стохастического характера – теория вероятностей, математическая статистика, теория матриц, теория

множеств и т.д. А при разработке системы распознавания применяются также методы исследования операций, теории игр, теории принятия решений и др.

В работе [3] проблема распознавания, заключающаяся в нахождении рабочего алфавита классов, рабочего словаря признаков, описания классов на языке признаков, оптимального состава комплекса технических средств системы распознавания, который при наилучшем решающем правиле обеспечивает наиболее эффективное решение задачи распознавания, в условиях наличия ограничений на используемые ресурсы для создания комплекса технических средств, сформулирована в виде оптимизационной задачи и приведен метод ее решения, основанный на математическом моделировании.

В работе [1] рассматриваются следующие методы анализа данных:

дискриминантный анализ - для построения разделяющих функций в признаковом пространстве;
выделение и выбор признаков - для сужения избыточного множества признаков до подмножества «наилучших признаков» или их комбинаций;
кластерный анализ - для разделения данных на подобные группы объектов.

В дискриминантном анализе формирование разделяющих функций основывается на одном из статистических или эвристических методов. Статистические методы нацелены на минимизацию ошибки классификации, представляющей собой вероятность неправильной классификации поступившего на распознавание k-мерного объекта Х. К таким методам относят [1]:

разделение с помощью квадратичной функции на основе использования плотностей нормального распределения;
разделение с помощью линейных функций на основе использования плотностей нормального распределения;
непараметрические методы, применяемые в случае отсутствия информации о виде кривой плотности распределения;
применение адаптивных разделяющих функций, позволяющих внесение изменений в значения их параметров при неправильной классификации.

Эвристические методы ориентированы на критерии, непосредственно связанные с имеющимися исходными данными. К этим методам относят [1]:

правило ближайшего соседа, в соответствии с которым, исследуемый объект относят к тому классу, к которому принадлежит его ближайший сосед из обучающей выборки;
правило К ближайших соседей;
оптимизация по какому-либо критерию ошибки выбранной разделяющей функции (линейной, квадратичной и т.д.), например, число неправильно классифицированных объектов из обучающей выборки, расстояние (среднее или "взвешенное") между обучающей выборкой и разделяющей функцией;
иерархическое разделение на основе применения дерева решений, в каждой вершине которого исследуется один из многих признаков, в зависимости от значения которого выбирается очередная ветвь. В нижней вершине принимается классификационное решение.

Выделение и выбор признаков может обуславливаться следующим: необходимостью нахождения совокупности признаков, порождающих только различие между классами; ограничением на время выполнения вычислительных процедур; ограниченными ресурсами на приобретение и создание технических средств системы распознавания и др. Для реализации этой цели применяется ряд критериев адекватности набора признаков. Например, критерий Фишера как одномерный критерий адекватности каждого признака для разделения двух классов, расстояние Махаланобиса как многомерный критерий для разделения различных классов, оценка совокупности признаков при полном или частичном переборе выбираемого подмножества признаков из исходного избыточного множества признаков и др.

Кластерный анализ служит инструментом для выделения структур, классов, множеств подобных объектов из исходных неклассифицированных совокупностей. Ввиду многоаспектного характера применения кластерного анализа ( социология, психология, биология, медицина, геология, астрономия и др.) в нем применяются разнообразные критерии, определяемые конкретными целями анализа в различных прикладных задачах. В литературе описано множество методов кластеризации, основанных на творческом подходе к использованию приемов кластерного анализа для создания «своего» метода кластеризации. Основы кластерного анализа изложены в работе [5].

Рассмотрим некоторые разновидности кластерного анализа. Одной из разновидностей методов кластерного анализа являются методы, основанные на отыскании моды распределения. В них полагается связь между кластерами и максимумами плотности распределения данных. Оценивая плотности распределения одним из известных методов и находя максимумы (моды) их соотносят с некоторыми кластерами. При необходимости возможно объединение ряда кластеров с целью реализации принадлежности исследуемого элемента среды к одному из кластеров.

При априорно известном числе кластеров возможно применение метода кластерного анализа,. критерием в котором является отношение внутрикластерной дисперсии к межкластерной дисперсии. В этом случае возможно также применение итеративного самоорганизующегося метода анализа данных, основанного на идее принадлежности объектов к кластеру с наиболее близким средним значением. Вначале, на перовм шаге, случайным образом выбирают средние значения для исходного разбиения «сгустков» объектов. Затем, на втором шаге, осуществляют отнесение объектов к тем кластерам, центры которых находятся от них на наименьшем расстоянии. Рассчитываются новые средние значения для кластеров и циклически повторяют второй шаг до завершения процесса кластеризации.

Следующей разновидностью методов кластерного ангализа являются иерархические схемы кластеризации. Вначале каждый объект рассматривается как отдельный кластер. Затем, пошагово осуществляют объединение исходных кластеров на основе установленных способов измерения расстояния между кластерами до тех пор, пока не будет получена искомая совокупность кластеров. При этом возможно применение интерактивного режима.

В распознавании объектов, явлений, ситуаций и т. д. возможно применение идей теории нечетких множеств, в которых принадлежность элементов к таким множествам может принимать любые значения в диапазоне 0 – 1. Нечеткие множества можно применять в условиях неопределенности для квантифицирования и формализации различных неопределенных и интуитивных утверждений типа «теплый день», когда установлено всего лишь два класса дней : «жаркий день» и «холодный день». Тогда «теплый день» может принадлежать классу «жаркий день», например, со значением принадлежности 0,6 и к классу «холодный день» со значением принадлежности 0,15. Сумма указанных двух значений может быть отличной от единицы. В теории нечетких множеств вводятся понятия объединения и пересечения множеств. Например, принадлежность к объединению нечетких множеств А и В элемента X(f_AB(x)), имеющего значение принадлежности к множеству А – f_A(x) . и к множеству В – f_B(x) , можно определить как:

f_AB(x) = max{ f_A(x), f_B(x)}, (11.5)

а принадлежность к пересечению нечетких множеств А и В – как

f_AB(x) = max{ f_A(x), f_B(x)}, (11.6)

В распознавании, например, могут применяться нечеткие метки, нечеткие признаки и нечеткие классификации.

Нечеткие метки могут использоваться для отражения неопределенности в принадлежности объектов обучающего множества к соответствующим классам. Это означает необходимость классификации объектов с учетом всех возможных классов. Использование нечетких меток в процессе обучения распознающей системы, вместо четких меток, указывающих однозначно принадлежность к определенному классу, может привести к получению более точных результатов классификации на этапе функционирования системы распознавания, поскольку в этом случае на этапе обучения используется больший объем информации и имеется возможность работать с более репрезентативным обучающим множеством, так как все объекты, включая сомнительные и «выбросы», могут быть помечены.

Введение понятия «нечеткие признаки» связано с искусственным «размыванием» значений признаков Х, представляющих результаты объективных измерений и не содержащих нечеткостей, посредством отображения на интервале

0,1 , например, в виде:

f_l(x) = exp(-x-x^e₀), (11.7)

где и - положительные постоянные, подлежащие определению,

x^e₀ - «идеальное» значение признака для класса l.

В процессе распознавания над значениями признаков могут выполняться опереции объединения, пересечения с помощью выше приведенных формул определения

f_AB(x), f_AB(x), (11.8)

Нечеткие классификации могут быть получены, реализуя указанные выше процедуры установления значений принадлежности элементов для всех классов. Нечеткость результатов классификации можно устранить либо алгоритмически – относя объект к классу, которому соответствует наибольшее значение принадлежности, либо в интерактивном режиме, когда лицо, принимающее решение, вырабатывает свое правило отнесения объекта к определенному классу, располагая при этом сведениями о вычисленных значениях принадлежности. Нечеткие классификации можно использовать в кластерном анализе при формировании критерия выделения кластеров с целью получения гибкого и исчерпывающего описания реально используемой стратегии.

При создании систем распознавания символов, речи, отпечатков пальцев, для обнаружения дефектов промышленных объектов, деталей машин и механизмов, в биологии, медицине и других отраслях описание образов выполняется через непроизводные элементы и их отношения на некотором «языке». Для описания таких образов создаются специальные грамматики, содержащие набор правил, позволяющих составлять образы из непроизводных элементов. Способы распознавания представленных таким образом объектов базируются на лингвистических (структурных) методах.

В заключение следует отметить, что в условиях многоаспектности предметных областей распознавания, разработано мощное множество конкретных методов, используемых в различных системах распознавания в разных целях. Эти методы являются результатом творчества их авторов во взаимодействии со знаниями, полученными в различных дисциплинах, например, таких как математика, физика, теория автоматов, теория информации, кибернетика, искусственный интелект, информатика, обработка изображений, лингвистика, теория нервных сетей, биология, социология и психология. Распознавание можно использовать в различных областях, как для имитации органов чувств человека или в качестве вспомогательного средства, так и для анализа сложных структур данных, например, с целью получения новых знаний.

Содержание