Активационные функции
-
Жесткая ступенька:
Рис. Жесткая ступенька.
Здесь θ – пороговый уровень нейрона. Данная функция используется в классическом искусственном нейроне. Нейроны с такой нелинейностью требуют малых вычислительных затрат. Данная функция чрезмерно упрощена и не позволяет моделировать схемы с непрерывными сигналами. Отсутствие первой производной затрудняет применение градиентных методов для обучения таких нейронов.
-
Логистическая функция (сигмоида):
Рис. Логистическая функция.
Эта функция часто применяется для сетей с непрерывными сигналами.
Она симметрична относительно точки с координатами NET = 0, OUT = 0,5, что делает равноправными значения OUT = 0 и OUT = 1. Тем не менее диапазон выходных значений от 0 до 1 несимметричен, что замедляет обучение соответствующей нейронной сети. Данная функция является сжимающей, т.к для малых значений NET коэффициент передачи K = OUT/NET велик, для больших значений он снижается. Поэтому диапазон сигналов, с которыми нейрон работает без насыщения, оказывается широким. Производная непрерывна и легко выражается через саму функцию, что ускоряет обучение нейрона.
-
Гиперболический тангенс:
Рис. Гиперболический тангенс
Также часто применяется для сетей с непрерывными сигналами. Фунция симметрична относительно точки (0, 0), что является преимуществом по сравнению с сигмоидой. Производная также непрерывна и легко выражается через саму функцию.
-
Пологая ступенька:
Легко рассчитывается, но имеет разрывную производную в точках NET = θ, NET = θ + Δ, что усложняет алгоритм обучения.
Рис. Пологая ступенька.
-
Гауссова кривая: .
Рис. Гауссова кривая.
Применяется в случаях, когда реакция нейрона должна быть максимальной для некоторого определенного значения NET.
Выбор функции активации определяется следующими факторами:
-
Спецификой задачи.
-
Удобством реализации на ЭВМ, в виде электрической схемы или другим способом.
-
Алгоритмом обучения: некоторые алгоритмы накладывают ограничения на вид функции активации, что необходимо учитывать.
Чаше всего вид нелинейности не оказывает принципиального влияния на решение задачи. Однако удачный выбор может сократить время обучения в несколько раз.
- Введение
- Место нейронных сетей среди других методов решения задач
- Биологический нейрон
- Искусственный нейрон
- Активационные функции
- Ограничения модели нейрона
- Однослойные искусственные нейронные сети
- Многослойные искусственные нейронные сети
- Обучение искусственных нейронных сетей
- Алгоритмы обучения
- Многослойный персептрон
- Xijl — I-й входной сигнал j-го нейрона в слое l ;
- Алгоритм решения задач с помощью мсп