logo
1

4.6.3. Методы аналитической обработки данных в хранилище

В аналитических системах для обработки данных используется очень широкая номенклатура методов. Это и традиционные статистические методы регрессионного, факторного, дисперсионного анализа, анализа временных рядов, а также методы, основанные на искусственном интеллекте. К последним, как правило, относят: нейронные сети, нечеткую логику, генетические алгоритмы, методы извлечения знаний. В совокупности они именуются методами интеллектуального анализа данных.

Часто используется англоязычный термин «data mining» (дословно — добыча знаний). Эти методы развивают традиционные статистическиеподходы, находя применение там, где обычные приемы невозможно использовать в силу отсутствия точных зависимостей, описывающих анализируемые процессы. Технологии интеллектуального анализа данных способны существенно расширить круг практически значимых задач, решаемых с использованием вычислительной техники.

В большинстве случаев средства анализа данных в СППР на основе ХД используются для решения следующих задач:

1) выделение в данных групп сходных по некоторым признакам записей (кластерный анализ);

2) нахождение и аппроксимация зависимостей, связывающих ана- лизируемые параметры или события, а также поиск параметров, наиболее значимых в терминах конкретной задачи;

3) поиск данных, существенно отклоняющихся от выявленных за кономерностей (анализ аномалий);

4) прогнозирование развития объектов различной природы на основе хранящейся ретроспективной информации об их состоянии в прошлом.