Информационные хранилища данных
Хранилище содержит сведения, поступающие из самых разных источников данных, функционирующих под управлением разных операционных модулей, а также различные накопительные и сводные данные.
Хранилище данных - предметно-ориентированный, интегрированный, привязанный ко времени и неизменяемый набор данных, предназначенный для поддержки принятия решений. Такое определение хранилищу данных было дано Уильямом Инмоном. Данные из различных источников помещаются в хранилище, а их описания — в репозиторий метаданных.
Архитектура хранилища данных состоит из следующих компонентов (рис. 5):
Оперативные данные - исходные данные, помещаемые в хранилище, поступающие из источников обработки данных.
Хранилище оперативных данных - представляет собой репозитарий для текущих и интегрированных оперативных данных.
Диспетчер загрузки - компонент, который выполняет все операции, связанные с извлечением и загрузкой данных в хранилище.
Диспетчер хранилища - выполняет все операции, связанные с управлением информацией, помещенной в хранилище данных.
Диспетчер запросов - выполняет все операции, связанные с управлением пользовательскими запросами.
Фактические данные – данные, которые хранятся в виде информации, агрегированной до следующего уровня детализации, а также регулярно вводящиеся в хранилище данные, пополняющие имеющиеся.
Архивные и резервные копии - отвечают за подготовку фактической и просуммированной информации, предназначенной для создания архивов и резервных копий.
Метаданные - данные о данных, которые используются любыми процессами хранилища.
Средства доступа к данным – это средства при помощи которых пользователи взаимодействуют с хранилищем.
Рис. 5. Архитектура хранилища данных
Информационные потоки в хранилище данных следующие:
Входной поток - выбирает информацию из источников данных с целью их последующей загрузки в хранилище данных.
Восходящий поток - выполняет суммирование, документирование и распределение исходных данных.
Нисходящий поток - включает процедуры, обеспечивающие возможность восстановления текущего состояния хранилища в случае потери данных из-за сбоев в программном или аппаратном обеспечении.
Выходной поток - обеспечивает выполнение запросов конечных пользователей к нужным данным и своевременную доставку информации на рабочие станции конечных пользователей.
Метапоток - это процесс, связанный с перемещением метаданных, т.е. данных о других потоках.
Данные, поступающие в хранилище данных, как правило, доступны только для чтения. Данные из OLTP-системы копируются в хранилище данных таким образом, чтобы построение отчетов и OLAP-анализ не использовал ресурсы транзакционной системы и не нарушал ее стабильность. Как правило, данные загружаются в хранилище с определённой периодичностью, поэтому актуальность данных может несколько отставать от OLTP-системы.
Назначение информационных хранилищ заключается в следующем:
интеграция данных в масштабе бизнес-процессов;
функционально-стоимостной анализ эффективности бизнес-процессов;
сложные аналитические запросы в разрезах: виды услуг, клиенты, регионы, технологии;
анализ данных в динамике и в сравнении с показателями отрасли.
В основу организации хранилища положены следующие принципы:
Проблемно-предметная ориентация. Данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют.
Интегрированность. Данные объединены так, чтобы они удовлетворяли всем требованиям предприятия в целом, а не единственной функции бизнеса.
Некорректируемость. Данные в хранилище данных не создаются: т.е. поступают из внешних источников, не корректируются и не удаляются.
Зависимость от времени. Данные в хранилище точны и корректны только в том случае, когда они привязаны к некоторому промежутку или моменту времени.
- Санкт-Петербург
- Раздел 1. Информационные процессы, системы и технологии 10
- Тема 1. Основные понятия информатики. Информатизация общества 10
- Тема 2. Основные сведения об информации и информационных процессах 25
- Тема 3. Информационные системы и технологии 37
- Раздел 2. Проектирование баз данных 59
- Тема 4. Основные понятия теории баз данных. Модели данных. 59
- Предусловие
- Введение
- Раздел 1. Информационные процессы, системы и технологии тема 1. Основные понятия информатики. Информатизация общества Понятие информации
- Взаимосвязь процессов компьютеризации и информатизации
- Понятие информационного ресурса, его потенциала и возможностей использования
- Основные проблемы информационного обеспечения науки, техники производства и управления
- Организационно-экономические аспекты информатизации
- Понятие технико-экономического обоснования
- Системно-информационный анализ и синтез в информатизации
- Новые информационные технологии в социально-экономических процессах
- Современные технические и программные средства информационных технологий.
- Вопросы по теме
- Тема 2. Основные сведения об информации и информационных процессах Понятие данных. Информация и ее роль в управлении.
- Атрибутивные и функциональные свойства информации
- Адекватность информации
- Общая характеристика процессов сбора, передачи, обработки и накопления информации.
- Системы классификации, кодирования и организации информации.
- Общая характеристика, назначение, классификация, структура и эффективность информационных систем
- Информационные технологии: общая характеристика, назначение, классификация
- Понятие информационного обеспечения, основные формы, принципы, организация личного и корпоративного информационного обеспечения
- Информатизация управленческого решения
- Модели решения функциональных и вычислительных задач.
- Предметная область. Модель предметной области
- Объекты и атрибуты, связи между объектами и атрибутами объектов
- Концептуальная модель
- Типы моделей данных
- Реляционная модель данных. Основные определения: отношения, домены, кортежи, атрибуты
- Первичный ключ. Свойства отношений реляционной бд
- Ограничения на отношения, основные операции над отношениями
- Вопросы по теме
- Тема 5. Основы проектирования баз данных Методология проектирования бд
- Основные этапы проектирования бд
- Методы проектирования
- Использование case - технологии при проектировании базы данных.
- Вопросы по теме
- Тема 6. Технологии обработки экономической информацией на основе использования субд Системы управления базами данных, их эволюция и классификация
- Функции субд. Типовая организация субд
- Состав и назначение языковых средств субд
- Информационная безопасность баз данных
- Перспективы развития субд
- Информационные хранилища данных
- Модели данных, используемые для построения информационных хранилищ
- Вопросы по теме
- Раздел 3. Субд access тема 7. Субд Access и ее структура Основные объекты Access
- Режимы доступа к базе данных
- Понятие о синхронизации и репликациях базы данных
- Администрирование базы данных
- Поля, их типы и свойства
- Фильтрация и сортировка записей в таблицах
- Вопросы по теме
- Тема 9. Конструирование запросов Запросы qbe и запросы sql
- Основы конструирования qbe-запросов
- Запросы на выборку
- Запросы-действия
- Вопросы по теме
- Тема 10. Конструирование форм и отчетов Основы конструирования форм
- Структура формы
- Элементы управления
- Основы конструирования отчетов
- Структура отчет. Группировка данных в отчетах
- Использование вычисляемых полей в отчете.
- Вопросы по теме
- Тема 11. Средства автоматизации субд Основы конструирования макросов. Структура макроса. Виды макрокоманд.
- Создание макроса данных, управляемого событием. Создание именованного макроса данных
- Сведения о параметрах
- Управление макросами данных
- Создание изолированных макросов
- Создание внедренного макроса
- Создание вложенных макросов
- Вопросы по теме
- Тема 13. Основы языка sql История развития sql.
- Основы языка sql
- Вопросы по теме
- Заключение
- Список литературы