3.5.2. Задачи Data Mining
Методы Data Mining помогают решить многие задачи, с которыми сталкивается аналитик. Из них основными являются: классификация, регрессия, поиск ассоциативных правил, кластеризация и прогнозирование. Ниже приведено краткое описание основных задач анализа данных.
Задача классификации сводится к определению класса объекта по его характеристикам. Необходимо заметить, что в этой задаче множество классов, к которым может быть отнесен объект, заранее известно.
Задача регрессии, подобно задаче классификации, позволяет определить по известным характеристикам объекта значение некоторого его параметра. В отличие от задачи классификации значением параметра является не конечное множество классов, а множество действительных чисел.
При поиске ассоциативных правил целью является нахождение частых, зависимостей (или ассоциаций) между объектами или событиями. Найденные зависимости представляются в виде правил и могут быть использованы как для лучшего понимания природы анализируемых данных, так и для предсказания появления событий.
Задача кластеризации заключается в поиске независимых групп (кластеров) и их характеристик во всем множестве анализируемых данных. Решение этой задачи помогает лучше понять данные. Кроме того, группировка однородных объектов позволяет сократить их число, а следовательно, облегчить анализ.
Перечисленные задачи делятся по назначению на описательные и предсказательные. Описательные (descriptive) задачи уделяют внимание улучшению понимания анализируемых данных. Ключевой момент в таких моделях — легкость и прозрачность результатов для восприятия человеком. Возможно, обнаруженные закономерности будут специфической чертой именно конкретных исследуемых данных и больше нигде не встретятся, но это все равно может быть полезно и потому должно быть известно. К такому виду задач относятся кластеризация и поиск ассоциативных правил. Решение предсказательных (predictive) задач разбивается на два этапа. На первом этапе на основании набора данных с известными результатами строится модель. На втором этапе она используется для предсказания результатов на основании новых наборов данных. При этом, естественно, требуется, чтобы построенные модели работали максимально точно. К данному виду задач относят задачи классификации и регрессии. Сюда можно отнести и задачи поиска ассоциативных правил, если результаты ее решения могут быть использованы для предсказания появления некоторых событий. ^
- Автоматизированные информационно-управляющие системы (часть 1) Казаринов л.С., Попова о.В., Барбасова т.А.
- 1. Основные понятия
- 2. Информационно-управляющие системы реального времени
- 2.1. Особенности иус реального времени
- 2.1.1. Определение и основные характеристики иу срв
- 2.1.2. Ядра и операционные системы реального времени (осрв)
- 2.1.3. Обзор систем реального времени
- 2.2. Построение иус реального времени на базе операционной системы qnx
- 2.3. Сравнение scada – систем
- 2.4. Scada – система trace mode
- 2.4.1. Обзор системы trace mode
- 2.4.2. Функциональная структура пакета
- 2.5. Программно-технический комплекс DeltaV
- 2.5.1. 3Обзор системы DeltaV
- 2.5.2. Концепции системы DeltaV
- 2.5.3. Программные приложения DeltaV
- 2.6. Полнофункциональный программно-технический комплекс Квинт (Государственный научный центр рф ниитеплоприбор)
- 2.6.1. Описание
- 2.6.2. Программно-технический комплекс Квинт
- 2.7. Siemens
- 2.7.1. Состав simatic Totally Integrated Automation
- 2.7.2. Примеры автоматизации асу тп
- 2.8.1. Основные направления деятельности
- 2.8.2. Системы управления, предлагаемые абб Автоматизация в России
- 3. Обеспечивающие подсистемы информационно-управляющих систем и их характеристики
- 3.1. Программное обеспечение цифровой фильтрации сигналов и трендов
- 3.2. Программное обеспечение управления непрерывными процессами
- 3.2.1. Реализация языков программирования стандарта мэк 6-1131/3 в системе trace mode
- 3.2.2. Описание языков программирования
- 3.2.3. Реализация регуляторов и объектов управления в scada-системе TraceMode
- 3.3. Программное обеспечение секвенциально-логического управления
- 3.3.1. Программируемые логические контроллеры
- 3.3.2. Языки программирования плк
- 3.3.3. Пример реализации секвенциально-логических алгоритмов в trace mode
- 3.4.1. Идентификация характеристик технологических объектов
- 3.4.2. Идентификация характеристик технологических объектов с использованием стандартных методов Excel
- 3.4.3. Решение задачи оптимизация технологических объектов
- 3.5. Средства интеллектуального анализа данных
- 3.5.1. Общие представления о Data Mining
- 3.5.2. Задачи Data Mining
- 3.5.3. Классы систем Data Mining
- 3.5.4. Основные этапы Data Mining