Постоянство
Четвертая определяющая характеристика хранилища данных – это постоянство. В оперативной среде операции обновления, добавления, удаления и изменения производятся над записями регулярно. Базовые манипуляции с данными хранилища ограничены начальной загрузкой данных и доступом к ним. В хранилище данных обновление данных не производится. Исходные (исторические) данные, после того как они были согласованны, верифицированы и внесены в хранилище данных, остаются неизменными и используются исключительно в режиме чтения.
Существуют важные последствия различия обработки данных в оперативной среде и обработки в хранилище данных. На уровне проектирования хранилища данных необходимость в поддержке механизмов, обеспечивающих корректность обновлений, отпадает – обновления в хранилище данных не производятся. Это означает, что на физическом уровне проектирования при решении проблемы нормализации и физической денормализации доступ к данным может оптимизироваться без каких-либо ограничений. Другое последствие простоты работы с данными хранилища касается технологии работы с данными. Технология работы с данными в оперативной среде отличается большей сложностью. Она поддерживает функции оперативного резервного копирования и восстановления, обеспечивает целостность данных, включает механизмы разрешения конфликтов и тупиковых ситуаций. Для обработки информации в хранилище данных указанные функции не столь критичны.
Характеристики хранилища данных – ориентированность на предметную область при проектировании, интегрированность данных, зависимость от времени и простота управления данными – определяют среду, которая существенно отличается от классической транзакционной среды.
Источником почти всех данных среды хранилища данных являются оперативные среды. Может возникнуть ощущение, что существует огромная избыточность данных в обеих средах. Однако на практике избыточность данных в средах минимальна, поскольку:
При передаче данных из оперативной среды в хранилище данных эти данные фильтруются. Многие данные вообще никогда не выгружаются из оперативной среды. В хранилище данных передается только информация, используемая для обработки в системе поддержки принятия решений.
Временной горизонт в средах существенно различается. Данные в оперативной среде всегда являются текущими. Данные в хранилище имеют хронологию. С точки зрения временного горизонта пересечение между оперативной средой и средой хранилища данных минимально.
Хранилище данных содержит агрегированные (итоговые) данные, которые никогда не включаются в оперативную среду.
Передача данных из оперативной среды в хранилище данных сопровождается фундаментальными преобразованиями. Большинство данных при поступлении в хранилище видоизменяется.
- Аналитические базы данных
- Содержание
- Введение
- Гипотеза — модель — решение.
- Лекция 1 Эволюция корпоративных информационных систем
- Лекция 2 olap системы на железнодорожном транспорте.
- Лекция 3 Основные понятия olap
- Общие свойства хранилищ
- Ориентированность на предметную область
- Интегрированность
- Зависимость от времени
- Постоянство
- Данные хранилища
- Источники данных
- Хранилище данных (в узком смысле)
- Оперативный склад данных (Operational Data Store - ods)
- Витрины данных (Datamart)
- Метаданные
- Компоненты хранилища
- Подсистема загрузки данных
- Подсистема обработки запросов и представления данных
- Подсистема администрирования хранилища
- Лекция 4 Методика (методология) построения хранилищ данных
- Постановка задачи Системно-аналитическое обследование
- Техническое задание
- Проектирование
- Автоматизируемые процессы и функции
- Информационное обеспечение
- Компонентная архитектура
- Техническая архитектура
- Реализация
- Внедрение
- Выбор метода реализации Хранилищ данных
- Лекция 5 Рынок bi
- Продукция Microsoft
- Аналитическая платформа Deductor
- Лекция 6olapкуб. Построение, работа с элементамиOlap-куба
- Invoices.Customers.CompanyName as
- Invoices.OrderDate, Categories.CategoryName,
- Invoices.ProductName,
- Invoices.Shippers.CompanyName as
- Некоторые термины и понятия
- Типичная структура хранилищ данных
- Таблицы измерений
- Olap на клиенте и на сервере
- Технические аспекты многомерного хранения данных
- Лекция 7 Data mining
- Условные сокращения и обозначения
- Словарь