Нейронные_сети_1

2.3 Формирование задачника для нейросети

Для информационных систем важным является вопрос формирования задачника. Это связано с тем, что для любого интеллектуального блока, которых в информационных системах довольно много, на входе формируется обучающая выборка, которая находится в постоянном динамическом изменении. Как правило, обучение производится не по всему задачнику, а по некоторой его части. Ту часть задачника, по которой в данный момент производится обучение, будем называть обучающей выборкой. Важность этого компонента определяется тем, что при обучении сетей всех видов с использованием любых алгоритмов обучения необходимо предъявлять примеры, на которых она обучается решению задачи. Кроме того, задачник содержит правильные ответы для сетей, обучаемых с учителем.

Настройка параметров функции (4.2) производится на основе обучающей выборки, которая содержит примеры, описывающие состояние объекта исследования, и значения целевого параметра, соответствующие каждому состоянию. Например, для задач оценки деятельности конкретного ВУЗа наиболее характерно применение временных отсчетов в качестве базового параметра измерения, т.е. примеры значений параметров объекта отличаются тем, что измерены в различные моменты времени. Соответствующая обучающая выборка представляется в виде матрицы M:

;

где и – границы временного интервала, определяемые экспертным путем.

Важным вопросом является разделение всех доступных данных на обучающую и тестовую выборки таким образом, чтобы обеспечить их независимость и представительность. Эта проблема решается для каждой конкретной задачи отдельно. Задачник формируется в результате функционирования информационной системы в ритме процессов производства и управления. Формирование происходит непосредственно в базах данных, причем даже для одного АРМа их может быть несколько.

Для рассматриваемых информационных систем основной структурой задачника является база данных реляционного типа. Каждому примеру соответствует одна запись базы данных. Каждому данному - одно поле. Поля базы данных могут быть числовыми и текстовыми. В зависимости от решаемой задачи содержимое задачника может меняться. Так, например, для решения задачи классификации без учителя используют нейросети, основанные на методе динамических ядер [207] (наиболее известным частным случаем таких сетей являются сети Кохонена [233,234]). Задачник для такой сети должен содержать только векторы входных данных. При использовании обучаемых сетей, основанных на принципе двойственности, к задачнику необходимо добавить вектор ответов сети. Кроме того, некоторые исследователи хотят иметь возможность просмотреть ответы, выданные сетью, вектор оценок примера, показатели значимости входных сигналов и, возможно, некоторые другие величины. Поэтому, стандартный задачник должен иметь возможность предоставить пользователю всю необходимую информацию. При формировании задачника должны активно использоваться возможности графики и цвета. [148].

Задачники формируются в результате функционирования информационной системы в базах данных в ритме процессов производства и управления в соответствии с разработанными технологиями. При этом выполняются процедуры погружения данных, описанные выше. Например, для задач прогнозирования возможны следующие варианты погружения информации: без пересечения, с пересечением, с дообучением, без дообучения, по совокупности временных рядов, в том числе возможны варианты с учетом сезонных колебаний, с учетом других качественных признаков (рис. 4.14). При организации задачников важными являются вопросы создания и обновления архивов, технологии формирования обучающих выборок по этапам технологического процесса обработки информации в автоматизированной системе.

На рисунке (4.14) представлены методы формирования выходных (целевых) параметров задачника нейросети. Наиболее качественные данные задачника получаются на основе фактической выборочной, экспериментальной информации, в том числе по данным происшедших событий, выполненных опытов и экспериментов. При решении неформализованных задач, таких ,например, как оценка состояния объекта управления, получение значения целевого параметра экспериментальным путем бывает невозможно. В этом случае используется экспертная информация, формируемая опытным специалистом в соответствующей области знаний или группой экспертов при помощи методов экспертной оценки [54].

При функционировании информационной системы, при постоянно изменяющемся состоянии предметной области, существенном обновлении данных задачника часто не представляется возможным своевременно привлечь опытных специалистов для выработки значений целевых параметров и последующего дообучения нейронной сети. Для этого в работе разработаны методы автоматического самообучения нейросетевых компонентов(рис.4.15). Они реализуются при помощи специально разработанных экспертных систем, содержащих знания опытных специалистов, по аналитическим методикам и зависимостям, с использованием фиксированных констант и множеств, определяющих значения целевых параметров "по умолчанию". На рисунке 4.15 представлен процесс функционирования нейросетевого решателя в режиме автоматического обучения. В данной схеме показано подключение экспертной системы для формирования значений целевого параметра перед дообучением нейронной сети. Однако следует отметить, что данный режим не должен быть

основным. В реально работающих информационных системах режим самообучения не должен иметь регулярного характера, так как при этом качество обучения нейросетевых элементов ухудшается. При эксплуатации информационных систем периодически должны подключаться группы экспертов для обновления целевых параметров обучающих выборок и последующего дообучения нейросетевых компонентов.

Содержание