logo search
FINAL (Verdana, 16)

32. Охарактеризуйте технологии olap. Объясните концепцию кубов данных и методы их построения с использованием современных систем.

OLAP – это система, основанная на технологии аналитической обработки данных в режиме реального времени (On-Line Analysis Processing). C помощью технологий OLAP производится обработки данных, заключающаяся в подготовке суммарной (агрегированной) информации на основе больших массивов данных, структурированных по многомерному принципу.

Плоские и многомерные таблицы.

В ячейках OLAP-куба – агрегированные значения. Они называются summary. Summary вычисляются на основе исходных данных – measure. Параметры запроса – dimension – «измерения» куба. Значения, откладываемые на осях куба, – члены измерений – members.Таблицы, состоящие из одного измерения, наз плоскими. Таблицы, содержащие более одного измерения, наз многомерными.

Таблица фактов явл основной таблицей хд, которая содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализир. Сущ. 4 наиб. часто встреч. типа фактов:

ТФ имеет уникальный составной ключ, объединяющий первичные ключи (ТИ). ТИ содержит неизменяемые либо редко изменяемые данные. Каждая ТИ должна находиться в отношении «один ко многим» с ТФ.

Особенности клиентских и серверных OLAP-средств, эффективность их исп-ния.

Способы хранения данных: MOLAP (Multidimensional OLAP) - исходные и агрегатные данные хранятся в многомерной БД. ROLAP (Relational OLAP) — исх. данные остаются в реляц. БД. HOLAP (Hybrid OLAP) — исх. данные остаются в той же реляц. БД, а агрегатные данные хранятся в многомерной БД.

Тест FASMI: FAST (Быстрый) – означает, что система должна обеспечивать выдачу большинства ответов пользователям в сжатые сроки. При этом самые простые запросы обрабатываются в течение одной секунды и очень немногие – более 20-ти.

ANALYSIS (Анализ) – означает, что система может справляться с любым логическим и статистическим анализом, характерным для данного приложения, и обеспечивает его сохранение в виде, доступном для конечного пользователя.

SHARED (Разделяемый) – означает, что система осуществляет все требования защиты конфиденциальности (возможно до уровня ячейки) и, если множественный доступ для записи необходим, обеспечивает блокировку модификаций на соответствующем уровне.

MULTIDIMENSIONAL (Многомерный) – означает, что система должна обеспечить многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий. Многомерность является ключевым критерием.

INFORMATION (Информация) – требуемая информация должна быть получена там, где она необходима.

OLAP-куб — многомерный массив данных, как правило, разрежённый и долговременно хранимый. Может быть реализован на основе универсальных реляционных СУБД или специализированным программным обеспечением.

Над гиперкубом могут выполняться следующие операции:

Срез– формируется подмножество многомерного массива данных, соответствующее единственному значению одного или нескольких элементов измерений, не входящих в это подмножество.

Вращение–Например, операция вращения может заключаться в перестановке местами строк и столбцов таблицы. Кроме того, вращением куба данных является перемещение внетабличных измерений на место измерений, представленных на отображаемой странице, и наоборот.

Консолидация и детализация– операции, которые определяют переход вверх по направлению от детального представления данных к агрегированному и наоборот, соответственно.