logo search
Лекции ИТМ

6.2. Нейросетевые технологии

Наряду с аналитическими инструментами нового поколения, основанными на применении логики нечетных множеств от электронных таблиц (Fuzzy Calc) до экспертных систем (Cubi Calc), все больший интерес для финансово-аналитической деятельности представляют аналитические информационные технологии, основанные на использовании так называемых нейронных сетей. Нейронные сети – обобщенное название групп алгоритмов, которые умеют обучаться на примерах, извлекая скрытые закономерности из потока данных. Компьютерные технологии, получившие название нейросетевых, работают по аналогии с принципами строения и функционирования нейронов головного мозга человека и позволяют решать широкий круг задач: распознавать человеческую речь и абстрактные формы, классифицировать состояние сложных систем, управлять технологическими процессами и финансовыми потоками, решать аналитические, исследовательские задачи и задачи прогнозирования, связанные с обширными информационными потоками.

Являясь мощным технологическим инструментом, нейросетевые технологии облегчают специалисту процесс принятия важных и неочевидных решений в условиях неопределенности, дефицита времени и ограниченных информационных ресурсов.

В начале 90-х годов появилось новое поколение мощных, недорогих и простых в использовании нейросетевых технологий. Одним из лидеров стал нейросетевой пакет Brain Maker американской фирмы California Scientific Software. Наибольшее применение нейронные сети нашли в финансово-кредитной сфере, где заинтересованные в совершенствовании аналитической работы банки стали интенсивно включать нейронные сетевые технологии в состав финансовых приложений.

Отличительной чертой нейронных сетей является их способность менять свое поведение (обучаться) в зависимости от изменения внешней среды, извлекая скрытые закономерности из потока данных. При этом алгоритмы обучения не требуют каких-либо предварительных знаний о существующих в предметной области взаимосвязях – необходимо только подобрать достаточное число примеров, описывающих поведение моделируемой системы в прошлом. Основанная на нейросетях технология не предъявляет повышенных требований к точности входных данных, как на этапе обучения, так и при ее использовании (после настройки и обучения), например при распознавании симптомов приближения кризисных ситуаций, для краткосрочных, а иногда и долгосрочных прогнозов. Таким образом, нейросетевая технология обладает двумя чрезвычайно полезными свойствами:

Взяв за основу работу мозга, создатели нейросетевых технологий ввели в употребление и ряд биологических терминов, понятий, параметров, а сам метод получил название генетического алгоритма. Генетический алгоритм реализован в популярном пакете Brain Maker Professional и в менее популярном, но более профессиональном Neuroforester. В этих пакетах генетический алгоритм управляет процессом общения на некотором множестве примеров, а также стабильно распознает (прогнозирует) новые ситуации с высокой степенью точности. Обучение сводится к работе по подбору весовых коэффициентов, который реализуется автоматически без непосредственного участия пользователя-аналитика.

В пакете Neuroforester для решения прогнозных задач большая часть процедур выполняется автоматически. В частности, автоматически выбирается оптимальное число дней, обеспечиваемых прогнозом. Пакет имеет также инструменты для предварительной обработки данных: корреляционный анализ, позволяющий определять значимость входных параметров прогноза; анализ с помощью масштабных преобразований для выявления скрытых циклов данных, диаграмма-распределение зависимости прогнозируемой величины от входных параметров. Эти методы позволяют уже на этапе подготовки данных выделять наиболее существенные для прогноза параметры. Все результаты обработки представляются в графическом виде, удобном для анализа и принятия решения.

При использовании нейросетевой технологии работа строится в несколько этапов.

Первым этапов является четкое определение проблемы, то есть того, что пользователь-аналитик собирается получить от нейросетевой системы на выходе. Это может быть некоторый вектор, характеризующий изучаемую систему или процесс. Например, кривая доходности ценных бумаг, состав инвестиционного портфеля, точки перелома тренда и т.п.

Вторым этапом является определение и подготовка исходных данных для реализации нейросетевой технологии. Отбирается вся необходимая, адекватно и полно описывающая процесс, информация. Сложность выполнения второго этапа состоит в том, что должен быть выдержан баланс между стремлением увеличить количество входных параметров и вероятностью получить плохо обучаемую сеть, которая может исказить результаты. Дело в том, что число дней ретроспективы и прогноза, которые зависят от свойств исследуемых данных, сильно влияют на точность прогноза. Поэтому выбор несоответственно большого числа дней для прогноза или малого их числа ретроспективы может привести к невозможности обучения системы.

Ввод данных в систему, подготовка данных, создание файлов для тренировки и тестирования составляют третий этап. Производится формирование необходимого набора ситуаций, с которыми придется работать аналитику, а затем проводится распределение исходных данных по этим ситуациям. При этом нейросетевая технология автоматически реализует задачу классификации, в основе которой лежит нечеткая логика. В качестве входных параметров могут быть использованы искусственно созданные характеристики системы, в частности для фондового рынка это могут быть различные индикаторы технического анализа.

На этапе подготовки данных анализируется степень их информационной насыщенности, для чего выявляется степень влияния конкретного параметра на прогнозируемую величину. При достижении равномерного наполнения всех степеней зависимости, выявляется соответствие между прогнозируемой величиной и параметром в виде «Если …, то …, иначе ….», что близко к реализации алгоритма нечеткой логики и экспертным системам.

Выбор типа нейросетевой технологии и метода обучения системы можно выделить в самостоятельный этап. Сеть может быть построена с помощью Net Maker в интерактивном режиме, пользуясь его подсказками, или создать файлы Brain Maker, пользуясь текстовым редактором. Для прогнозирования временных рядов, которыми описываются финансовые рынки, предпочтительно воспользоваться генетическим алгоритмом Genetic Algorithms, а для решения задач распознавания образов и классификации – сетевыми технологиями Hopfield и Kohonen. Наиболее трудоемким процессом является настройка нейросети на обучающую выборку данных, поскольку здесь определяется оптимальное количество параметров, свойств исследуемых данных, оптимальное число дней ретроспективы и прогноза. Хорошо продуманные способы задания тестовых множеств в сочетании с несколькими вариантами обучающих алгоритмов (от стандартных до скоростных) и заданием различных критериев остановки обучения предоставляют широкие возможности для экспериментов.

Все современные нейросетевые технологии содержат систему конверторов, дающих возможность пользоваться данными, подготовленными в стандартных исходных форматах, например, в Excel. При этом можно использовать как числовые, так и текстовые данные, преобразуя наборы символов в уникальный набор чисел. Ward System допускает также обратную операцию, то есть представление результатов работы сети в виде не только чисел, но и связного текста, что позволяет генерировать результаты в виде информационных сообщений.

Правила для обучения нейросети могут задаваться посредством их ввода в готовом виде, а также в виде чисел, требующих дополнительных преобразований данных. Причем эти ограничивающие и разрешающие правила и условия могут вводиться в процессе решения задачи. Другим методом задания правил в Ward System является работа с индикаторами технического анализа. Включение индикаторов в процесс обучения существенно повышает не только точность прогнозов, но и их стабильность и статистическую достоверность.

Работоспособность обученных сетей проводится на тестовой выборке данных. По результатам тестов отбираются наиболее перспективные варианты. При этом руководствуются тем, что точность и надежность прогноза прежде всего зависят от типа прогнозируемой величины, состояния, в котором находится исследуемая система (стационарное, вблизи критической точки), типа системы (управляемая извне или замкнутая). Например, наиболее точен и надежен прогноз локального изменения тренда в стационарном состоянии рынка.

После завершения полного цикла подготовки системы можно создать для каждой задачи независимые приложения в виде отдельного файла, который может использоваться другими программами. Полученный вариант нейросетевой технологии представляет собой упакованную нейросеть с описанными функциями передачи данных команд управления.

Гибкость и мощность нейронных сетей открывает перед ними практически неограниченные возможности применения, особенно в качестве аналитических инструментов в таких плохо формализуемых и многокритериальных областях, как анализ финансовой и банковской деятельности. Любая задача, связанная с использованием финансовых средств на валютном рынке или рынке ценных бумаг, сопряжена с риском и требует тщательного анализа и прогноза. Точность прогноза, устойчиво достигаемая нейросетевыми технологиями при решении реальных задач, привела к росту количества примеров успешного применения сетевых программных продуктов.