Некоторые термины и понятия
Наряду с суммами в ячейках OLAP-куба могут содержаться результаты выполнения иных агрегатных функций языка SQL, таких как MIN, MAX, AVG, COUNT, а в некоторых случаях — и других (дисперсии, среднеквадратичного отклонения и т.д.). Для описания значений данных в ячейках, используется термин summary(в общем случае в одном кубе их может быть несколько), для обозначения исходных данных, на основе которых они вычисляются, — терминmeasure, а для обозначения параметров запросов — терминdimension(переводимый на русский язык обычно как «измерение», когда речь идет об OLAP-кубах, и как «размерность», когда речь идет о хранилищах данных). Значения, откладываемые на осях, называются членами измерений (members).
Говоря об измерениях, следует упомянуть о том, что значения, наносимые на оси, могут иметь различные уровни детализации. Например, нас может интересовать суммарная стоимость заказов, сделанных клиентами в разных странах, либо суммарная стоимость заказов, сделанных иногородними клиентами или даже отдельными клиентами. Естественно, результирующий набор агрегатных данных во втором и третьем случаях будет более детальным, чем в первом. Заметим, что возможность получения агрегатных данных с различной степенью детализации соответствует одному из требований, предъявляемых к хранилищам данных, — требованию доступности различных срезов данных для сравнения и анализа.
Поскольку в рассмотренном примере в общем случае в каждой стране может быть несколько городов, а в городе — несколько клиентов, можно говорить об иерархиях значений в измерениях. В этом случае на первом уровне иерархии располагаются страны, на втором — города, а на третьем — клиенты (рис. 10).
Рис. 10. Иерархия в измерении, связанном с географическим положением клиентов
Отметим, что иерархии могут быть сбалансированными (balanced), как, например, иерархия, представленная на рис.10, а также иерархии, основанные на данных типа «дата—время», и несбалансированными (unbalanced). Типичный пример несбалансированной иерархии — иерархия типа «начальник—подчиненный» (ее можно построить, например, используя значения поля Salesperson исходного набора данных из рассмотренного выше примера), представлен нарис. 11.
Иногда для таких иерархий используется термин Parent-child hierarchy.
Рис. 11. Несбалансированная иерархия
Существуют также иерархии, занимающие промежуточное положение между сбалансированными и несбалансированными (они обозначаются термином ragged — «неровный»). Обычно они содержат такие члены, логические «родители» которых находятся не на непосредственно вышестоящем уровне (например, в географической иерархии есть уровни Country, City и State, но при этом в наборе данных имеются страны, не имеющие штатов или регионов между уровнями Country и City; рис. 12).
]
Рис. 12. «Неровная» иерархия
Отметим, что несбалансированные и «неровные» иерархии поддерживаются далеко не всеми OLAP-средствами. Например, в Microsoft Analysis Services 2000 поддерживаются оба типа иерархии, а в Microsoft OLAP Services 7.0 — только сбалансированные. Различным в разных OLAP-средствах может быть и число уровней иерархии, и максимально допустимое число членов одного уровня, и максимально возможное число самих измерений.
Заключение:
В данном разделе мы ознакомились с основами OLAP. Мы узнали следующее:
Назначение хранилищ данных — предоставление пользователям информации для статистического анализа и принятия управленческих решений.
Хранилища данных должны обеспечивать высокую скорость получения данных, возможность получения и сравнения так называемых срезов данных, а также непротиворечивость, полноту и достоверность данных.
OLAP (On-Line Analytical Processing) является ключевым компонентом построения и применения хранилищ данных. Эта технология основана на построении многомерных наборов данных — OLAP-кубов, оси которого содержат параметры, а ячейки — зависящие от них агрегатные данные.
Приложения с OLAP-функциональностью должны предоставлять пользователю результаты анализа за приемлемое время, осуществлять логический и статистический анализ, поддерживать многопользовательский доступ к данным, осуществлять многомерное концептуальное представление данных и иметь возможность обращаться к любой нужной информации.
Кроме того, мы рассмотрели основные принципы логической организации OLAP-кубов, а также узнали основные термины и понятия, применяемые при многомерном
В следующей статье данного цикла мы рассмотрим типичную структуру хранилищ данных, поговорим о том, что представляет собой клиентский и серверный OLAP, а также остановимся на некоторых технических аспектах многомерного хранения данных.
- Аналитические базы данных
- Содержание
- Введение
- Гипотеза — модель — решение.
- Лекция 1 Эволюция корпоративных информационных систем
- Лекция 2 olap системы на железнодорожном транспорте.
- Лекция 3 Основные понятия olap
- Общие свойства хранилищ
- Ориентированность на предметную область
- Интегрированность
- Зависимость от времени
- Постоянство
- Данные хранилища
- Источники данных
- Хранилище данных (в узком смысле)
- Оперативный склад данных (Operational Data Store - ods)
- Витрины данных (Datamart)
- Метаданные
- Компоненты хранилища
- Подсистема загрузки данных
- Подсистема обработки запросов и представления данных
- Подсистема администрирования хранилища
- Лекция 4 Методика (методология) построения хранилищ данных
- Постановка задачи Системно-аналитическое обследование
- Техническое задание
- Проектирование
- Автоматизируемые процессы и функции
- Информационное обеспечение
- Компонентная архитектура
- Техническая архитектура
- Реализация
- Внедрение
- Выбор метода реализации Хранилищ данных
- Лекция 5 Рынок bi
- Продукция Microsoft
- Аналитическая платформа Deductor
- Лекция 6olapкуб. Построение, работа с элементамиOlap-куба
- Invoices.Customers.CompanyName as
- Invoices.OrderDate, Categories.CategoryName,
- Invoices.ProductName,
- Invoices.Shippers.CompanyName as
- Некоторые термины и понятия
- Типичная структура хранилищ данных
- Таблицы измерений
- Olap на клиенте и на сервере
- Технические аспекты многомерного хранения данных
- Лекция 7 Data mining
- Условные сокращения и обозначения
- Словарь