3.3. Системы поддержки принятия решения
Информационные системы, которые используются для предоставления необходимых данных при принятии управленческих решений, используют в качестве основного элемента хранилище данных. Такие системы получили условное обозначение OLAP (On Line Analysis Processing).
В отличие от обычной базы данных в хранилище данных размещается информация, полученная от различных источников. Основная операция, которая выполняется в хранилище данных это добавления новых данных. Данные добавляются большими блоками с большим интервалом. При этом данные, поступающие из различных источников, должны быть обработаны и приведены к общему формату.
Использование технологии хранилища данных позволяет:
оперативно обеспечить пользователей системы необходимой информацией для принятия управленческого решения;
построить модель данных организации;
создать интегрированный источник данных для доступа к различной информации.
Информация, которая собрана в хранилище данных, должна обладать следующими особенностями:
содержать достоверное описание предметной системы;
содержать интегрированные данные, т.е. данные, собранные из различных источников и приведенные к определенному формату;
сами данные не меняются, в хранилище добавляют только новые данные.
Данные должны храниться в хронологическом порядке. Для этого используется специальный атрибут, позволяющей упорядочить информацию по времени или по календарной дате. Расположение информации в хронологическом порядке позволяет ускорить процесс получения ответа на запрос пользователя.
В отличие от систем обработки транзакций запрос к системе принятия решений преследует цель получить не конкретный факт, а определенный результат.
Например, запрос в OLTP системе может иметь структуру:
«Вывести курс доллара к рублю на начало дня»
Запрос в OLAP системе имеет структуру:
«Какое среднее значение имел курс доллара к рублю в течение прошлой недели».
Рис.3.1. Структура гиперкуба.
Для организации хранилища данных используют различные архитектуры. Базовая концепция организации хранилища данных «гиперкуб», т.е. используется объемная модель хранения данных. Такая архитектура предусматривает использование трех мерной технологии хранения. Данное хранится в определенной «ячейке» куба и характеризуется тремя измерениями: объект, атрибут, время. На рисунке 3.1 показана ячейка гиперкуба. На рисунке:
объект – определенная сущность предметной области;
атрибут – свойство данной сущности;
время – временной интервал, в котором изменяется атрибут объекта.
С данными, которые находятся в трехмерном пространстве, выполняют следующие операции:
сечение – выделение подмножества из гиперкуба с фиксированными значениями по одному или нескольким измерениям.
вращение – изменение порядка представления измерений в двумерном сечении.
свертка – одно значение измерения заменяется значением боле высокого уровня иерархии. Например, если получено значение соответствующее определенному временному параметру, то операция свертки позволяет получить значения соответствующие всем временным отметкам интервала.
детализация – обратная операция свертке. Значение получается для конкретной временной отметки интервала.
Многомерная технология хранения данных в оперативной памяти позволяет успешно решать задачи связанные с аналитической обработкой сложных запросов, так в оперативной памяти располагаются все данные гиперкуба. Однако такое размещение данных может привести к невозможности оперирования большими объемами данных, так как вычислительная система может обладать недостаточными ресурсами оперативной памяти.
Для снятия ограничения на объем данных используется многомерная реляционная технология размещения данных. Данные размещают, используя принцип звезды.
Рис.3.2. Трехмерное реляционное хранилище данных.
Хранилище данных в этом случае представляет собой набор таблиц. Таблицы бывают двух типов:
фактологические. В схеме звезда такая таблица одна. В такой таблице находится поле, в котором записано значение атрибута, и размещено несколько индексных полей одно индексное поле – код параметра остальные индексные поля – коды записей в справочных таблицах.
справочные. При трехмерной организации хранилища данных таких таблиц соответственно три. В первой таблице хранятся описания параметров – атрибутов, вторая таблица хранит описания объектов, третья таблица хранит описания временных характеристик.
Развертывание OLAP системы выполняется на основе технологии клиент – сервер. Для сочетания быстродействия предоставляемого многомерным способом хранения данных и возможностей хранения неограниченного объема данных при использовании реляционной модели используется следующая архитектура OLAP системы:
хранилище данных строится с использованием реляционной технологии размещения данных;
для решения аналитических задач подразделениями фирмы создают киоски данных с многомерными базами данных в оперативной памяти.
В такой схеме киоск это специализированное тематическое хранилище данных, построенное в виде многомерной структуры. Данные в киоск загружаются из центрального хранилища.
Для получения оперативной информации о хранилище данных оно снабжается описанием. Описание образуют метаданные. Метаданные позволяют получить информацию о структуре данных в хранилище, периодичности их обновления. Могут содержать сведения о методах доступа и правилах предоставления результатов. Метаданные образуют репозиторий.
Системы OLAP позволяют решать следующие задачи:
кластерный анализ – выделение в наборе данных группы по некоторым сходным признакам;
аппроксимация зависимостей, связывающих анализируемые параметры;
анализ аномалий – поиск данных существенно отклоняющихся от выявленных закономерностей;
прогнозирование развития объектов, на основе ретроспективной информации.
- Основы построения автоматизированных информационных систем
- Глава 1. Системный подход при разработке автоматизированных информационных систем
- 1.1. Общие положения
- 1.2. Автоматизированные информационные системы
- 1.3. Автоматизированные системы в управлении
- 1.4. Методы анализа автоматизированных информационных систем
- 1.5. Структура автоматизированной информационной системы
- Глава 2. Методы проектирования информационных систем
- 2.1. Обобщенная модель информационной системы и методы проектирования
- 2.2. Каноническое проектирование информационных систем
- 2.3. Управление требованиями, спецификация rup
- 2.4. Модели жизненного цикла информационной системы
- 2.5. Использование case технологий при разработке информационных систем
- 2.6. Методологии case проектирования
- 2.6.1. Методология datarun
- 2.6.2. Методология rad
- 2.6.3. Графические нотации
- 2.7. Системные методологии анализа
- 2.7.1. Методология aris
- 2.7.2. Методология baan
- 2.7.3. Методология Oracle
- 2.7.4. Методология Betec (©)
- Глава 3. Особенности современных информационных систем
- 3.1. Корпоративные информационные системы
- 3.2. Системы обработки транзакций
- 3.3. Системы поддержки принятия решения
- 3.4. Экспертные информационные системы
- 3.4.1. Основы создания информационных систем в Visual Prolog
- 3.4.2. Управления поиском решения в vip
- 3.4.3 Использование рекурсии
- 3.4.4. Управление потоком ввода–вывода
- 3.4.5. Особенности составления описания предметной области
- 3.4.6. Особенности работы с базой фактов
- 3.5. Объектно–ориентированные системы
- 3.6. Документальные системы
- 3.6.1. Информационно-поисковый язык
- 3.6.2. Структра поисковой системы
- 3.7. Гипертекстовые информационные системы
- 4. Управление процессом проектирования автоматизированной информационной системы
- 4.1. Методы управления качеством разработки аис
- 4.2. Оценка эффективности функционирования автоматизированных информационных систем
- 4.2.1. Экономическая эффективность
- 4.2.2. Производительность вычислительной системы
- 4.2.3. Оценка качества работы пользователя системы
- Приложения Приложение №1. Базовые сведения о языке программирования Visual Prolog
- Приложение №.2. Компилирование программ в Visual Prolog ver 5.2.
- Приложение №.3. Программа «Внутренняя база данных фактов»
- Приложение №.4. Программа «Внешняя база данных»
- Приложение №5.Некоторые стилевые параметры
- Список литературы