logo
Основы_БД_ХД

2.1. Хранилище данных

Хранилище данных обычно создается для решения задач анализа, прогнозирования и планирования, связанных с поддержкой принятия решений. Данные в хранилище представляют собой пополняемый набор, единый для всего предприятия и позволяющий восстановить картину его деятельности на любой момент времени, а структура данных хранилища проектируется таким образом, чтобы выполнение запросов к нему осуществлялось максимально эффективно.

Хранилище данных (Data Warehouse) – предметно-ориентированная информационная корпоративная база большого объема, специально разработанная и предназначенная для сбора и предварительной обработки данных с целью предоставления результирующей информации пользователям для статистического анализа, подготовки отчётов, анализа бизнес-процессов.

Хранилище данных отличается от обычной базы данных следующими особенностями:

– данные, поступающие в хранилище, становятся доступными только для чтения;

– обычные базы данных подвержены постоянным изменениям в процессе работы пользователей, а хранилище данных относительно стабильно: данные в нем обычно обновляются согласно расписанию (например, еженедельно, ежедневно или ежечасно в зависимости от потребностей). Процесс пополнения представляет собой добавление новых данных за определенный период времени без изменения прежней информации, уже находящейся в хранилище;

– данные, находящиеся в хранилищах предназначены не для повседневной работы, как в обычных БД, а для обеспечения принятия решений, требующих анализа, прогнозирования, планирования. Например, продажа товара и выписка счета производятся с использованием базы данных, предназначенной для обработки транзакций, а анализ динамики продаж за несколько лет, позволяющий спланировать работу с поставщиками, – с помощью хранилища данных.

Обычные базы данных являются основными источниками данных, попадающих в хранилище. Кроме того, хранилище может пополняться и за счет других источников, например статистических отчетов.