3.5.1. Общие представления о Data Mining
Характерной особенностью современных систем управления являются сбор и обработка значительных объемов данных от объекта управления. В современных автоматизированных системах управлениях (АСУ) на системном уровне собирается информация от десятков, сотен и более источников информации, причем эта информация поступает в течение длительных периодов времени, которые могут исчисляться годами. Для аккумулирования указанных данных используется системы управления базами данных. Базы данных могут носить не только локальный характер, но и выступать частью интегрированных корпоративных сетей. Поэтому объем информации, который находится на системном уровне АСУ, является огромным. Анализ этих данных позволяет решать различные задачи управления. При этом до начала 90-х годов двадцатого века основным инструментом анализа являлась математическая статистика. Основной концепцией, на которой основывалось применение математической статистики, являлась концепция усреднения по выборке. Эта концепция приводит к операциям над средними величинами, которые, зачастую, являются неинформативными. С целью преодоления указанного недостатка статистического подхода начала развиваться технология интеллектуального анализа данных (ИАД), или Data Mining («добыча данных»). Data Mining — исследование и обнаружение "машиной" (алгоритмами, средствами искусственного интеллекта) в сырых данных скрытых знаний, которые ранее не были известны, нетривиальны, практически полезны, доступны для интерпретации человеком. Рассмотрим свойства обнаруживаемых знаний, данные в определении, более подробно. Свойства, которыми должны обладать обнаруженные знания: 1. Знания должны быть новые, ранее неизвестные. Затраченные усилия открытие знаний, которые уже известны пользователю, не окупаются. 2. Нетривиальность. Результаты анализа должны отражать неочевидные, неожиданные закономерности в данных, составляющие так называемые скрытые знания. Результаты, которые могли бы быть получены более простыми способами (например, визуальным просмотром), не оправдывают привлечение мощных методов Data Mining. 3. ^ Практическая полезность. Найденные знания должны быть применимы, в том числе и на новых данных, с достаточно высокой степенью достоверности. Полезность заключается в том, чтобы эти знания могли принести определенную выгоду при их применении. 4. ^ Доступность для понимания человеком. Найденные закономерности должны быть логически объяснимы, в противном случае существует вероятность, что они являются случайными. Кроме того, обнаруженные знания должны быть представлены в понятном для человека виде. В основу современной технологии ИАД положена концепция шаблонов, которые отражают фрагменты многих аспектов отношений данных. Эти шаблоны представляют собой закономерности, свойственные подвыборкам данных, которые могут быть выражены в форме, понятной человеку. Поиск шаблонов производится методами, которые не ограничены априорными предположениями о структуре выборки, законах распределения величин и т.п. Примеры заданий на такой поиск при использовании ИАД приведены в таблице 3.2.
Таблица 3.2
Статистический анализ данных | Интеллектуальный анализ данных |
Каковы средние показатели потребления природного газа на электростанциях? | Какие станции достигли наиболее эффективного потребления газа? В какие интервалы времени? Существуют ли шаблоны связи эффективности потребления газа с режимными факторами энергетических производственных процессов? |
Какова суммарная мощность энергетического оборудования, находящегося в ремонте по сравнению с мощностью работающего оборудования? | Имеются ли характерные признаки состояния энергетического оборудования, которое, по всей вероятности, может отказать в течение данного периода эксплуатации? |
Какова средняя величина превышения нормативов потребления электроэнергии прокатным станом? | Существуют ли стереотипные сочетания режимных факторов процесса прокатки, которые обуславливают перерасход энергии? |
^
- Автоматизированные информационно-управляющие системы (часть 1) Казаринов л.С., Попова о.В., Барбасова т.А.
- 1. Основные понятия
- 2. Информационно-управляющие системы реального времени
- 2.1. Особенности иус реального времени
- 2.1.1. Определение и основные характеристики иу срв
- 2.1.2. Ядра и операционные системы реального времени (осрв)
- 2.1.3. Обзор систем реального времени
- 2.2. Построение иус реального времени на базе операционной системы qnx
- 2.3. Сравнение scada – систем
- 2.4. Scada – система trace mode
- 2.4.1. Обзор системы trace mode
- 2.4.2. Функциональная структура пакета
- 2.5. Программно-технический комплекс DeltaV
- 2.5.1. 3Обзор системы DeltaV
- 2.5.2. Концепции системы DeltaV
- 2.5.3. Программные приложения DeltaV
- 2.6. Полнофункциональный программно-технический комплекс Квинт (Государственный научный центр рф ниитеплоприбор)
- 2.6.1. Описание
- 2.6.2. Программно-технический комплекс Квинт
- 2.7. Siemens
- 2.7.1. Состав simatic Totally Integrated Automation
- 2.7.2. Примеры автоматизации асу тп
- 2.8.1. Основные направления деятельности
- 2.8.2. Системы управления, предлагаемые абб Автоматизация в России
- 3. Обеспечивающие подсистемы информационно-управляющих систем и их характеристики
- 3.1. Программное обеспечение цифровой фильтрации сигналов и трендов
- 3.2. Программное обеспечение управления непрерывными процессами
- 3.2.1. Реализация языков программирования стандарта мэк 6-1131/3 в системе trace mode
- 3.2.2. Описание языков программирования
- 3.2.3. Реализация регуляторов и объектов управления в scada-системе TraceMode
- 3.3. Программное обеспечение секвенциально-логического управления
- 3.3.1. Программируемые логические контроллеры
- 3.3.2. Языки программирования плк
- 3.3.3. Пример реализации секвенциально-логических алгоритмов в trace mode
- 3.4.1. Идентификация характеристик технологических объектов
- 3.4.2. Идентификация характеристик технологических объектов с использованием стандартных методов Excel
- 3.4.3. Решение задачи оптимизация технологических объектов
- 3.5. Средства интеллектуального анализа данных
- 3.5.1. Общие представления о Data Mining
- 3.5.2. Задачи Data Mining
- 3.5.3. Классы систем Data Mining
- 3.5.4. Основные этапы Data Mining