Нейронные_сети_1

2.9Оценка и коррекция нейросетевой модели

Для оценки качества полученной модели используется оценка работы нейросети на тестовой выборке, или ошибка обобщения. Она характеризует способность ИНС обрабатывать новые данные в отличие от ошибки обучения, которая отражает качество настройки нейросети на конкретные примеры. Наиболее распространенным методом оценки моделей является метод перекрестного оценивания [252].

В случае, если ошибка сети превышает допустимую, необходимо вернуться на предыдущие этапы построения модели и изменить некоторые параметры нейросети.

Первым этапом коррекции модели является генерация нескольких экземпляров нейросети и их обучение, т.к. результаты обучения зависят от начальных значений весов синапсов, которые генерируются для каждой сети случайным образом. После обучения нескольких экземпляров, выбирается сеть с минимальной тестовой ошибкой. Различные нейросети могут ошибаться на различных примерах тестовой выборки. В этом случае можно сформировать комитет из нейросетей и вычислять окончательный ответ по задаче как среднее арифметическое ответов отдельных сетей. В этом случае средняя ошибка комитета будет меньше средней ошибки каждой нейросети [57]. Изменение вида или параметров функции оценки также может улучшить качество работы ИНС. В [41] предлагается следующая методика обучения сетей с оценкой МНК с допуском: устанавливается максимальное значение допуска, сеть обучается, затем величина допуска постепенно снижается с дообучением сети, пока оценка не достигнет требуемого уровня.

Если нейронная сеть заданной структуры не может удовлетворительно решить задачу, возможно несколько вариантов действий:

Добавление новых нейронов, новых слоев.
Увеличение значения характеристики крутизны функции (4.3).
Уменьшение значения характеристики крутизны функции (4.3).

Первые два варианта исходят из предположения, что модель недостаточно сложна или имеет недостаточную величину константы Липшица (4.5) для освоения задачи. Третий вариант предполагает, что нейросетевая функция недостаточно гладка для удовлетворительной аппроксимации. Уменьшение характеристики приведет к сглаживанию функции (4.3).

Для повышения качества модели могут быть использованы различные методы предобработки данных, например, сглаживание и фильтрация, кодирование количественного признака как дискретного, изменение состава обучающей выборки, изменение состава параметров, описывающих исследуемый объект. В настоящее время процесс коррекции нейросетевых моделей носит эвристический характер и основан на знаниях эксперта о конкретной задаче предметной области.

Содержание