logo
стоэи

30. Модели хранилищ данных и основные компоненты хранилищ данных.

Модели хранилищ данных:

- схема «звезда».Такая схема состоит из двух типов таблиц: одной таблицы фактов – центр «звезды» и нескольких таблиц измерений по числу измерений в модели данных – лучи «звезды». Таблица фактов является основной таблицей хранилищ данных и содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализироваться, а также содержит уникальный составной ключ, объединяющий первичные ключи таблиц измерений.

Четыре наиболее часто встречающиеся типа фактов:

1. факты, связанные с транзакциями – основаны на отдельных событиях (типичными примерами которых являются телефонный звонок или снятие денег со счета с помощью банкомата).

2. факты, связанные с «моментальными снимками», - основаны на состоянии объекта (например, банковского счета) в определенные моменты времени, например, на конец дня или месяца. Типичными примерами таких фактов являются объем продаж за день или дневная выручка.

3. факты, связанные с элементами документа, - основаны на том или ином документе (например, счете за товар или услуги) и содержат подробную информацию об элементах этого документа (например, количестве, цене, проценте скидки).

4. факты, связанные с событиями или состоянием объекта, - представляют возникновение события без подробностей о нем (например, просто факт продажи или факт отсутствия таковой без иных подробностей).

Пример «звезды».

- схема «снежинка».Данная схема получила свое название за форму отображения логической схемы таблиц в многомерной БД. Так же как и в схеме «звезда», схема «снежинка» представлена централизованной таблицей фактов, связанной с таблицами измерений. Отличием является то, что в ней таблицы измерений нормализованы с рядом других связанных измерительных таблиц, в то время как в схеме «звезда» таблицы измерений полностью денормализованы с каждым измерением. Чем больше степень нормализации таблиц измерений, тем сложнее выглядит структура схемы «снежинка». Создаваемый «эффект снежинки» затрагивает только таблицы измерений и не применим к таблицам фактов. Схема «снежинка», так же как и схема «звезда», наиболее часто встречается в таких ХД, для которых скорость получения данных более важна, чем эффективность их манипуляции.

Схема «снежинка» более подходит для среды с множеством запросов сложной структуры».

Пример «снежинки».

- ER-диаграмма.

Основные компоненты хранилищ данных:

-оперативные источники данных;

-средства переноса и трансформации данных;

-метаданные;

-реляционное хранилище;

-OLAP-хранилище иOLAP-клиенты;

-средства доступа и анализа данных.

Назначение перечисленных компонентов таково. Оперативные данные собираются из различных источников. Поступившие оперативные данных очищаются, интегрируются и складываются в реляционные хранилища. Они уже доступны для анализа при помощи средств построения отчетов. Затем дынные (полностью или частично) подготавливаются с использованием средств переноса и трансформации данных для OLAP-анализа. При этом они могут быть загружены в специальную базу данных OLAP или оставаться в реляционном хранилище.

Важнейшим элементов хранилища являются метаданные, т.е. данные о структуре, размещении, трансформации данных, которые используются любыми процессами хранилища. Метаданные могут быть востребованы для различных целей, например, извлечения и загрузки данных, обслуживании хранилища и запросов. Метаданные для различных процессов могут иметь различную структуру, т.е. для одного и того же элемента данных может существовать несколько вариантов метаданных.

Таким образом, хранилища данных являются структурированными. Они содержат базовые данные, которые образуют единый источник для обработки данных во всех системах поддержки принятия решений. Элементарные данные, присутствующие в хранилищах, могут быть представлены в различной форме. Хранилища данных исключительно велики, поскольку в них содержатся интегрированные и детализированные данные.