logo
ИТ в экономике

3.4.3. Интеллектуальный анализ данных (Data Mining)

Дословно термин Data Mining означает "добыча, раскопка знаний" [79, 80]. Какие же новые возможности предоставляет эта технология анализа по сравнению с OLAP - технологией? Строя аналитические отчеты описанными выше методами, вы заранее предполагаете, от каких размерностей зависит изменение значений фактов, а отчет показывает, какова эта зависимость. Например, вы получаете отчет, который показывает, как зависит регулярность выплат по кредитам частных лиц от сезона, количества членов семьи и так далее. Однако в задачах прогнозирования, при подготовке выпуска новой продукции или создании новой услуги часто необходимо решать задачи такого рода: "Каковы характерные особенности клиентов, которые, скорее всего, воспользуются этой услугой или приобретут этот товар?" или "Каковы характеристики сделок с недвижимостью, которые заканчиваются невыплатами?". То есть вы должны находить новые знания на базе уже накопленной фактической информации. Именно такие задачи помогает решать технолоия Data Mining. В основе этой технологии лежит концепция построения шаблона. Например, анализируя большое количество сделок с недвижимостью, мы ищем характерные особенности тех, что закончились невыплатами. Эти особенности и будут составлять шаблон. Если какая-то потенциальная сделка обладает этими особенностями, стоит отказаться от нее под благовидным предлогом. Таким образом, Интеллектуальный анализ данных представляет собой поиск закономерностей (шаблонов) на основе анализа большого количества данных. На основе найденных закономерностей, могут быть решены задачи прогнозирования будущих событий и трактовки данных, не соответствующих найденным закономерностям. Найденные шаблоны представляют собой новые знания, так как отражаемые ими закономерности бывают часто совершенно неожиданными для аналитиков. Поэтому технология Data Mining в настоящее время является самым совершенным инструментом анализа.

Интеллектуальный анализ данных включает пять типов исследований, для которых применяются разные математические методы.

В целом, можно сказать, что технология Data Mining может быть использована: в розничной торговле, банковском деле (например, для выявления мошенничества с кредитными карточками), телекоммуникациях (для внедрения привлекательных для клиентов услуг), страховом деле (анализ страховых выплат и установка страховых премий), медицине (установка диагноза и определение технологии лечения), производстве (анализ факторов, приводящих к возникновению брака).

Аналитические программные комплексы, реализующие технологию Data Mining, в основном являются предметно - ориентированными. То есть они ориентированы на определенный сектор бизнеса и учитывают его специфику. Например, программные продукты корпорации Oracle позволяют предвидеть запросы клиентов, анализировать результаты продаж, то есть они являются частью средств создания систем взаимодействия с клиентами (CRM - см. п. 2.1) [81]. Основным продуктом является Oracle Data Mining Suite. С помощью этого продукта можно разбить всех клиентов компании на категории, предсказывать изменения объемов продаж в зависимости от тех или иных условий. Продукт может извлекать данные из баз данных Oracle и других производителей, позволяет реализовывать параллельные вычисления, увеличивая скорость обработки терабайтов данных. Построенные с помощью Oracle Data Mining Suite модели предвидения (то есть новые знания) могут быть использованы в приложении Oracle CRM 11i, чтобы показать, например, списки клиентов, которые с наибольшей вероятностью ответят на определенные маркетинговые предложения. Для упрощения работы пользователя, в Oracle Data Mining Suite встроены специальные утилиты - мастера: мастер построения моделей; мастер поиска параметров, которые максимально влияют на решение конкретного вопроса; мастер экспорта и импорта данных. Для построения моделей могут быть использованы нейронные сети, "рассуждения на основе аналогичных случаев", деревья классификации.