logo search
Сборник методов нейроинформатики

2.9 Вычисление показателей значимости параметров и входных сигналов сети

У нейронной сети имеется набор n-мерных векторов данныхxi,i=1,..,N(задачник) с координатамиxji,j=1,..,n,M-мерный вектор параметровaс координатамиak,k=1,..,M, и некоторая функция оценкиH(x,a), оценивающая работу сети с параметрамиaна векторе данныхx. Требуется выделить у сети наименее значимые параметрыakи сигналыxjи модифицировать систему, отбрасывая эти параметры и компоненты данных.

Для каждого akопределено некоторое значениеak0и сокращениеakозначает приравниваниеak=ak0. Аналогично для каждой компоненты данныхxj и любого примераxiопределеноxji0 и отбрасываниеj-ой компоненты данных дляi-го примера означает приравниваниеxj= xji0.

Такая процедура допускает очень большую свободу в доопределении процедуры сокращения описания. В качестве простейшего базового варианта будем иметь в видуak0=0 и для всехi (параметры обращаются в нуль, данные заменяются средними по выборке). В случае данных, отнормированных, например, в диапазон [-1,1], в качествеxji0, естественно, принимается нуль.

Показатели значимости вычисляются в два этапа: сначала они вычисляются для одного вектора данных (примера), а потом – по всей выборке. Для данного xpзначимостиakиxjоцениваются так:

;

.

Здесь – просто вычисленные в линейном приближении абсолютные величины измененияHпри сокращении описания, частные производные вычисляются при двойственном функционировании. Естественно, значение функции оценки должно быть ненулевым. Поэтому, если используются специализированные функции оценки, на этапе вычисления значимости необходимо возвращаться к оценке МНК.

Оценка по всему задачнику производится с использованием некоторой нормы, например, c использованием нормы в виде суммы модулей

;

или максимума модулей.

;.

Часто приходится иметь дело с системой, которая меняет свои параметры, например, в ходе обучения. Тогда к моменту принятия решения о значимости может быть накоплена информация о частных производных Hв разных точкахa=a1,..,aq. Тогда показатели значимости для одного вектора данных вычисляются так:

;

.

Усредняются абсолютные значения производных, а приращения берутся в той точке, в которой будет проводиться процедура сокращения. Далее для всей выборки показатели значимости усредняются в одной из норм.

Использование вычисленных таким образом показателей значимости часто позволяет очень сильно сократить как число входных сигналов сети (остается только минимально необходимый для правильного решения задачи набор признаков), так и число элементов сети.

Если необходимо не исключать из сети адаптивные элементы, а приводить их значения к конечному набору выделенных значений, то для каждого ak в качествеak0 принимается ближайшее кakвыделенное значение. Такая задача возникает при бинаризации весов синапсов сети – приведении весов синапсов к величинам -1 или 1.