Хранилища данных и системы оперативной аналитической обработки данных
Рассмотренные способы и возможные архитектуры информационных систем, предназначены для оперативной обработки данных, т.е. для получения текущей информации, позволяющей решать повседневные проблемы корпорации. Объективно сложилось так, что внедрение информационных технологий в подавляющем большинстве организаций осуществлялось без стратегического плана развития (по мере развития технического и программного обеспечения, по мере осознания необходимости автоматизации того или иного участка деятельности), отдельными, изолированными друг от друга фрагментами.
Следствием этого на сегодняшний день в большинстве организаций функционируют разнородные и слабо связанные между собой информационные системы, которые функционируют на различных технических и операционно-системных платформах, и используют различные СУБД. Эти системы обслуживают в первую очередь текущую, повседневную деятельность отдельных подразделений (бухгалтерию, кадры, склад, маркетинг и т.д.). Такие информационные системы получили название транзакционных или OLTP (On-Line Transactions Processing).
Существующее состояние корпоративных информационных систем характеризуется значительно возросшим объемом данных, накопленных за многие годы. Накопленные данные позволяют ставить и решать значительно более сложные задачи тактического и стратегического планирования развития компании и ее подразделений – возрос удельный вес задач по извлечению, сбору и представлению пользователю информации о состоянии и прогнозе развития. Проанализировав поведение корпорации на рынке с учетом сопутствующих внешних факторов и спрогнозировав хотя бы ближайшее будущее, требуется выработать тактику, а возможно, и стратегию корпорации. Для решения таких задач требуются данные и прикладные программы, отличные от тех, которые используются в оперативных информационных системах. В результате выработался подход, основанный на концепциях хранилища данных и системы оперативной аналитической обработки данных.
Информационные системы, ориентированные на решение подобного класса задач, получили название систем поддержки принятия решений. Подобные системы генерировали заранее предопределенные формы предоставления информации на основе данных, получаемых из транзакционных систем. Каждый раз, при построении нового отчета, приходится обеспечивать совместный доступ к данным, имеющимся в транзакционных системах, при помощи сетевого оборудования и средств операционных систем. По мере увеличения количества корпоративных транзакционных систем, объемов данных и задач топология объединения разрозненных источников данных все более усложнялась.
Для эффективного решения задач управления необходимо предоставить пользователям единый взгляд на корпоративную информацию независимо от того, где она физически хранится, - появилась технология хранилищ данных.
Одна из главных идей технологии хранилищ данных заключается в том, чтобы собрать в едином, по крайней мере с точки зрения пользователя, месте – супербазе всю информацию, которая может понадобиться при принятии решения.
Два подхода к интеграции корпоративной информации: децентрализованное и централизованное объединение источников.
Основа такого хранилища данных – информационные системы, основанные на различных СУБД, обслуживающие повседневную деятельность.
Хранилища данных не заменяют существующие системы, а являются надстройкой над ними.
Хранилище данных (Data Warehouse) — предметно-ориентированная информационная база данных, специально разработанная и предназначенная для подготовки отчётов и бизнес-анализа с целью поддержки принятия решений в организации. Строится на базе систем управления базами данных и систем поддержки принятия решений. Это одни из наиболее динамично развивающихся направлений индустрии информационных систем.
Основная цель хранилищ – создание единого логического представления данных, содержащихся в разнотипных БД, - единой модели корпоративных данных, ориентированных на поддержку принятия управленческих решений.
Хранилище данных - неизменяемое собрание данных, предметно ориентированное, интегрированное, поддерживающее хронологию.
Хранилище данных - автоматизированная система, состоящая из организационных, технических средств, БД или совокупности БД (хранилище в узком смысле) и программного обеспечения со следующими функциями:
- извлечение данных из разрозненных источников, их трансформация и загрузка в хранилище;
- извлечение данных из хранилища, аналитическая обработка и представление конечному пользователю;
- администрирование данных и хранилища.
Такое расширенное толкование данных понимается как "Система поддержки принятия решения (СППР)" или "OLAP-система".
OLAP-система имеет отличное от OLTP-систем функциональное назначение - не заменяет их, а надстраивается над ними и использует транзакционные системы в качестве источников данных. OLAP-система не анализирует данные, а предоставляет пользователю инструмент для такого анализа.
Данные архивов и внешних источников используются транзакционными (OLTP) и аналитическими (OLAP) системами. С помощью транзакционных систем решаются задачи обеспечения оперативной информацией и оперативными регламентированными отчетами (на основе реляционных баз данных), с помощью аналитических систем – задачи обеспечения аналитическими данными, нерегламентированными отчетами (на основе реляционных и многомерных баз данных).
Распределение функций между аналитическими и транзакционными информационными системами для различных типов пользователей приведено на рисунке.
OLTP-системы строятся на основе реляционной модели.
OLAP-системы могут быть построены как на основе реляционной базы (Relation OLAP - ROLAP), так и на основе многомерных баз (Multidimensional OLAP - MOLAP).
Производительность многомерных баз на несколько порядков выше и не зависит от объема данных в базе.
В многомерной модели данные представляются в виде многомерного куба, где измерения соответствуют осям, а данные – ячейкам. Многомерная модель позволяет делать плоские разрезы куба и поворачивать его нужной гранью в зависимости от потребности.
Структура организации хранилища ориентирована на предметные области.
Рассогласование приложений прикладного окружения объясняется множеством средств разработки, каждое из которых диктует определенные правила, и множеством способов разработки приложений, что отражается на способах создания ключевых структур. Полной согласованности между системами, созданными в разное время различными разработчиками, не будет.
Распределение функций между аналитическими и транзакционными информационными системами
Компоненты хранилища: подсистемы загрузки данных из различных источников, обработки запросов и представления данных, администрирования хранилища.
Подсистема загрузки извлекает данные из источников и приводит их к единому формату, определенному для хранилища. Подсистема обеспечивает согласованность, качество и интеграцию данных, которые загружаются из источников в оперативный склад данных. Каждый источник данных требует разработки собственного загрузочного модуля.
Подсистема обработки запросов и представления данных обеспечивает: регламентированные и нерегламентированные запросы пользователей, а также реализует сложные алгоритмы для поиска скрытых закономерностей и представления их в виде моделей и многовариантного прогнозирования развития ситуаций.
Подсистема администрирования обеспечивает регулярное пополнение данных, поддержание архитектуры хранилища и его эффективной работы, разграничение доступа к данным и защиту информации.
В состав программного обеспечения, предназначенного для проектирования, создания и сопровождения СППР входят: серверы реляционных и многомерных баз данных, серверы приложений, средства разработки программного обеспечения компонентов хранилища и приложений, готовые приложения.
- 1 Методологические основы моделирования сложных систем
- 1.1 Системность
- Понятия общей теории систем
- Определение понятия системы
- Основные свойства, обязательные для любой системы.
- Взаимодействие и взаимозависимость системы и внешней среды.
- Определение понятий элементов, связей, функций, внешней среды системы. Элемент
- Внешняя среда
- Функции системы
- Сложность систем
- Системный подход
- Классификация систем
- Развитие искусственной системы и ее жизненный цикл
- 1.2 Моделирование
- Общая методология моделирования
- Основные принципы моделирования:
- Процесс моделирования
- Анализ и синтез в моделировании
- Примеры сложных систем Космическая система наблюдения Земли как сложная техническая система Задачи космической системы наблюдения Земли
- Состав и структура космической системы наблюдения Земли
- 2 Построение математических моделей
- 2.1 Математическая модель, математическое моделирование – основные понятия, термины и определения
- Цели математического моделирования
- 2.2 Общие методы построения математической модели
- Микроподход и макроподход в исследованиях системы.
- Формальная запись модели системы
- Понятие вариационных принципов
- Модульное построение моделей
- 2.3 Требования к построению модели
- Адекватность и достоверность модели
- Равнозначимость внешнего и внутреннего правдоподобия
- Анализ чувствительности модели
- Пример анализа на чувствительность экономической задачи
- 3 Математические модели состояния и структуры системы
- 3.1 Модель состояния системы Состояние системы и ее функционирование
- Формализация процесса функционирования системы
- 3.2 Модель структуры системы Основные понятия структуры системы
- Модель состава и структуры системы
- Методология моделирования структуры системы
- Виды структур
- Формирование структуры модели с позиций структурного моделирования.
- Построение структурных моделей
- 3.3 Модель процесса функционирования
- Установление функциональных зависимостей
- Неопределенность функционирования системы
- Пути уменьшения неопределенностей
- Основные требования к модели процесса функционирования
- Анализ функционирования, анализ структуры технической системы
- Функционально – физический анализ технических объектов.
- Пример разработки моделей деятельности организации
- Пример функционально – физического анализа технических объектов
- Конструкция бытовой электроплитки
- Функционально стоимостной анализ.
- 4 Этапы построения моделей
- 4.1 Постановка задачи моделирования
- Разработка содержательной модели
- Разработка концептуальной модели
- Описание внешних воздействий
- Декомпозиция системы
- Подготовка исходных данных для математической модели
- Содержание концептуальной модели
- 4.2 Разработка математической модели
- Разработка функциональных соотношений
- Выбор метода решения задачи
- Проверка и корректировка модели
- Анализ чувствительности модели
- Проверка адекватности модели
- Контроль модели
- Корректировка модели
- Уточнение модели проектируемого объекта
- Реализация математической модели в виде программ для эвм
- 4.3 Практическое использование построенной модели и анализ результатов моделирования
- Примеры построения моделей Математическая реставрация Тунгусского феномена
- 1. Сбор информации о явлении, выдвижение гипотез.
- 2. Содержательная постановка задачи исследования явления.
- 3. Математическая постановка задачи.
- 4. Анализ результатов.
- 5. Проверка адекватности модели – сравнение с натурным экспериментом.
- 6. Анализ результатов.
- Прогноз климатических изменений
- 1. Содержательная постановка задачи
- 2. Концептуальная постановка. Построение математической модели.
- 3. Проведение вычислительного эксперимента.
- 4. Анализ результатов вычислительного эксперимента.
- 5 Виды математических моделей
- 5.1 Классификация математических моделей
- Пример представления модели различной сложности и классификации.
- 5.2 Классификация математических моделей в зависимости от оператора модели
- Линейные и нелинейные модели
- Обыкновенные дифференциальные модели
- 5.3 Классификация математических моделей в зависимости от параметров модели Непрерывные и дискретные модели
- Детерминированные и неопределенные модели
- Дискретно-детерминированная модель
- Статические и динамические модели
- Стационарные и нестационарные модели.
- Формализация системы в виде автомата
- Формализация системы в виде агрегата
- Моделирование процесса функционирования агрегата
- Моделирование агрегативных систем
- Модель сопряжения элементов
- 6 Математические модели распределения ресурсов в исследовании операций
- 6.1 Моделирование операций распределения ресурсов
- Формулировка задачи математического программирования
- 6.2 Модели линейного программирования
- Формулировка общей задачи линейного программирования.
- Типовые задачи линейного программирования
- Транспортная задача.
- Задача коммивояжера.
- Задача о ранце.
- Общая задача теории расписаний.
- Примеры сведения практических задач к канонической транспортной задаче
- 6.3 Распределительные задачи линейного программирования
- Примеры распределительных задач.
- Распределение транспортных единиц по линиям
- Выбор средств доставки грузов.
- Задача о назначениях
- Экономическая интерпретация задач линейного программирования.
- Перевозки взаимозаменяемых продуктов
- Перевозка неоднородного продукта на разнородном транспорте.
- 7 Математические модели физических явлений и процессов. Универсальность моделей
- 7.1 Математические модели на основе фундаментальных законов
- Теоретический метод составления математических моделей
- Основные фундаментальные законы механики
- Работа, энергия, мощность
- 7.2 Уравнения движения
- Динамика поступательного движения.
- 7.3 Уравнения состояния
- Термодинамическая система.
- Упругие свойства твердых тел.
- Жидкости.
- 7.4 Универсальность моделей
- Модели на основе аналогий
- Типовые математические модели элементов и подсистем
- Модель колебательного процесса
- Модель консервативной системы.
- Электрическая подсистема.
- Модели элементов гидравлических систем
- Модели элементов пневматических систем
- 8 Моделирование производственных процессов
- 8.1 Модели систем массового обслуживания
- Основные элементы систем массового обслуживания.
- Характеристики потока
- Классификация смо
- Оценка эффективности смо
- Аналитические и статистические модели
- 8.2 Модели производственных процессов
- Дискретный производственный процесс
- Непрерывный производственный процесс
- Агрегатное представление производственного процесса
- Имитационное моделирование процессов функционирования
- Формализация основных операций производственного процесса Формализованная схема дискретного производственного процесса.
- Формализация отклонения течения производственного процесса от нормального
- Моделирование комплексного процесса обработки, сборки и управления при поточном производстве
- Формализованная схема непрерывного производственного процесса.
- 9 Синтез модели (проекта) системы
- 9.1 Проектирование системы как процесс создания (синтеза) ее модели
- 9.2 Методология проектирования
- Типовые проектные процедуры формирования облика системы
- 9.3 Эффективность системы Понятие эффективности системы
- Формирование модели цели системы
- Выбор критериев и показателей эффективности
- Основные принципы выбора критериев эффективности:
- Проблемы многокритериальности
- 9.4 Технология проектирования
- 9.5 Принятие решений в проектировании
- Выбор в условиях неопределенности
- Моделирование принятия решения
- Прогнозирование в принятии решений
- 9.6 Анализ инвестиционной привлекательности системы Основные типы инвестиций.
- Основные экономические концепции инвестиционного анализа.
- Состав работ при инвестиционном проектировании
- Конкурентоспособность проектируемой системы Оценка потенциальной емкости рынка и потенциального объема продаж
- Оценка конкурентоспособности
- Методы оценки эффективности инвестиций
- Метод определения чистой текущей стоимости.
- Метод расчета рентабельности инвестиций
- Метод расчета внутренней нормы прибыли
- Расчет периода окупаемости инвестиций
- Маркетинг и управление проектом
- Задачи управления проектами
- 9.7 Особенности синтеза модели (проекта) технических систем Этапы проектирования
- Особенности проектирования адаптивных систем
- Моделирование функционирования технической системы Особенности построения моделей при проектировании
- Формирование технического облика системы
- Формирование структуры системы
- Выбор основных проектных параметров системы
- Формирование множества вариантов системы
- 10 Информационное обеспечение синтеза системы
- 10.1 Основные задачи и типы информационных систем Общие свойства информационных систем
- Файл-серверные информационные системы
- Клиент-серверные информационные системы
- Архитектура Интернет/Интранет
- Хранилища данных и системы оперативной аналитической обработки данных
- 10.2 Особенности проектирования информационных систем
- Схемы разработки проекта
- 1. Предпроектные исследования
- 2 Постановка задачи
- 3 Проектирование системы
- Архитектура программного обеспечения
- Подсистема администрирования.
- Техническая архитектура
- Организационное обеспечение системы
- 4 Реализация и внедрение системы
- 10.3 Концепции автоматизации проектирования
- История развития сапр
- Классификация сапр
- Стратегическое развитие сапр Современное состояние сапр
- Направления разработки проектной составляющей сапр
- Разновидности сапр
- Математическое и информационное обеспечение сапр
- 11 Моделирование процесса управления
- 11.1 Основные определения
- Формальная запись системы с управлением
- 11.2 Модели систем автоматического управления
- Устойчивость движения систем
- Определение программного движения и управление движением
- 11.3 Модели автоматизированных систем управления
- Модели автоматизированных систем управления производственными процессами
- Модели автоматизированных систем управления предприятием