logo
Информационные технологии управления

Спуск и консолидация

Спуск и консолидация - это специальная техника анализа, используемая при изучении данных. Пользователь имеет возможность переходить вверх по направлению от детального (down) представления данных к агрегированному (up) и наоборот. Направление детализации (обобщения) может быть задано как по иерархии отдельных измерений, так и согласно прочим отношениям, установленным в рамках измерений или между измерениями. Например, если при анализе данных об объемах продаж в Сумской области выполнить операцию drill-down для измерения "Регион", то на экране будут отображены такие его элементы как "Сумы", "Шостка", и "Ахтырка". В результате дальнейшей детализации элемента "Сумы" будут отображены элементы "Заречный р-н", "Ковпаковский р-н", "Сумский р-н" и т. д. Даже трехмерный куб сложно отобразить на экране компьютера так, чтобы были видны значения интересующих мер, еще более сложно визуализировать кубы с количеством измерений, большим трех. Для представления данных, хранящихся в кубе, применяются, как правило, привычные двумерные, т.е. табличные, представления, имеющие сложные иерархические заголовки строк и столбцов. Двумерное представление куба можно получить, "разрезав" его поперек одной или нескольких осей (измерений), в этом случае фиксируются значения всех измерений, кроме двух, т.е. получается обычная двумерная таблица. В горизонтальной оси таблицы (заголовки столбцов) представлено одно измерение, в вертикальной (заголовки строк) - другое, а в ячейках таблицы - значения мер. При этом набор мер фактически рассматривается как одно из измерений - выбирается для показа либо одна мера (и тогда можно разместить в заголовках строк и столбцов два измерения), либо показывается несколько мер (и тогда одну из осей таблицы займут названия мер, а другую - значения единственного "неразрезанного" измерения).

Пример.

На рисунке изображены:

  • слева - двумерный срез куба для одной меры Unit Sales (продано штук) и двух "неразрезанных" измерений - Store (Магазин) и Время (Time)

  • справа представлено лишь одно "неразрезанное" измерение - Store, но зато здесь отображаются значения нескольких мер - Unit Sales (продано штук), Store Sales (сумма продажи) и Store Cost (расходы магазина)

  • внизу - двумерное представление куба, когда "неразрезанными" остается более двух измерений. При этом на осях среза (строках и столбцах) будут размещены два или более измерений "разрезаемого" куба.

Поддержка многомерной модели данных и выполнение многомерного анализа данных осуществляются отдельным приложением или процессом, называемым OLAP-сервером. Клиентские приложения могут запрашивать требуемое многомерное представление и в ответ получать те или иные данные. При этом OLAP-серверы могут хранить многомерные данные разными способами

В процессе анализа пользователь может менять точку зрения на данные (так называемая операция смены логического взгляда), просматривая данные в различных разрезах и разрешая конкретные задачи. Над кубами могут выполняться различные операции, включая прогнозирование и условное планирование (анализ типа “что, если”). Причем операции выполняются над кубами, т.е. произведение, например, даст в результате произведение-гиперкуб, каждая ячейка которого является произведением ячеек соответствующих гиперкубов-множителей.

Однако куб сам по себе для анализа не пригоден. Если еще можно адекватно представить или изобразить трехмерный куб, то с шести - или девятнадцатимерным дело обстоит значительно хуже. Поэтому перед употреблением из многомерного куба извлекают обычные двумерные таблицы. Эта операция называется "разрезанием" куба. Термин этот образный, аналитик как бы берет и "разрезает" измерения куба по интересующим его меткам. Этим способом аналитик получает двумерный срез куба и с ним работает. Соответственно, "неразрезанными", как правило, остаются только два измерения - по числу измерений таблицы. Бывает, "неразрезанным" остается только измерение - если куб содержит несколько видов числовых значений, они могут откладываться по одному из измерений таблицы.

Если внимательно всмотреться в таблицу, на основании которой был создан куб, можно заметить, что находящиеся в ней данные, скорее всего, не являются первичными, а получены в результате суммирования по более мелким элементам. Например, предприятие делится на производства, производства на цеха, цеха на участки, и т.д. Станки можно объединять в группы оборудования и т.д. В терминах OLAP такие многоуровневые объединения называется иерархиями. Средства OLAP дают возможность в любой момент перейти на нужный уровень иерархии. Причем, как правило, для одних и тех же элементов поддерживается несколько видов иерархий: например участок-цех-производство. Исходные данные берутся из нижних уровней иерархий, а затем суммируются для получения значений более высоких уровней. Для того чтобы ускорить процесс перехода, просуммированные значения для разных уровней хранятся в кубе. Таким образом, то, что со стороны пользователя выглядит одним кубом, грубо говоря, состоит из множества более примитивных кубов.