logo
МИРЭА / Методичка_2010 / Методичка_2010

Многослойные персептроны. Правило Хебба.

Сети данного типа обучаются по аналогии с процессом самообучения живых существ. Базовые составляющие большинства теорий обучения живых существ можно обозначить так:

1) поисковая активность.

2) поощрение успеха.

3) наказание неуспеха.

Основная идея, заменяющая градинтный спуск, состоит в формализации базовых компонент (активность-поощрение-наказание) и построении на этой основе алгоритмов обучения. Из методов такого рода наиболее распространена группа методов, основанная на обобщенном правиле Хебба.

Это правило дает формализацию наказаний и поощрений. Кратко идея такова: наказание состоит в усилении тормозных и ослаблении возбуждающих связей, поощрение же, напротив, - в усилении возбуждающих и ослаблении тормозных. При этом предполагается, что наказание разрушит ошибочные действия, а поощрение усилит успешные.

Наказание именно разрушает, а не исправляет - нет направления спуска, неясно, куда "лучше". Тенденция неправильно действовать ослабляется. За счет поисковой активности появляются удачи, которые фиксируются поощрением.

После некоторого времени обучения поисковая активность может быть не совсем случайной - появляется ряд запретов, с одной стороны, и преимущественных направлений - с другой.

Обучение заканчивается либо после того, как все примеры обучающей выборки классифицированы правильно, либо после того, как синаптическая карта практически перестает меняться.