4.6.1. Хранилища данных
Для получения интересующей их информации лица, принимающие решение, или аналитики обращаются к СППР с запросами. Эти запросы в большинстве случаев более сложные, чем те, которые применяются в системах операционной обработки данных, например: «Найти среднее значение промежутка времени между выставлением счета и оплатой его участником ВЭД в текущем и прошедшем году отдельно для разных групп участников ВЭД».
В большинстве случаев сложный аналитический запрос невозможно сформулировать в терминах языка SQL, поэтому для получения информации применяют специальные языки, ориентированные на аналитическую обработку данных. К их числу можно, например, отнести язык Express 4GL фирмы Oracle. Также для выполнения запросов могут быть использованы приложения, написанные специально для решения тех или иных задач.
Для того чтобы можно было извлекать полезную информацию из данных, они должны быть организованы особым образом. Связано это со следующими факторами.
Во-первых, для выполнения аналитических запросов необходима обработка больших информационных массивов. Чем выше степень нормализации базы данных и чем больше в ней таблиц, тем медленнее выполняется анализ. Происходит это, прежде всего, потому, что увеличивается число операций соединения отношений. Нормализация таблиц базы данных позволяет устранить избыточность данных, уменьшив тем самым объем действий, необходимых при обновлении информации. Поэтому в них нет необходимости менять одни и те же значения в различных отношениях. В аналитических системах данные практически не обновляются — в системе производится лишь их накопление и чтение. Поэтому проблема нормализации базы данных в них не столь актуальна.
Во-вторых, выполнение некоторых аналитических запросов, напри мер анализ тенденций и прогнозирование, хронологической упорядоченности данных. Реляционная модель не предполагает существования порядка записей таблицы.
В-третьих, при обслуживании аналитических запросов чаще используются не детальные, а обобщенные (агрегированные) данные. Так, например, для прогнозирования объема импорта в некотором регионе будет излишним иметь информацию о каждом пересекающим таможенную границу контейнере, достаточно знать значение прогнозируемой величины за несколько предыдущих лет.
Перечисленные особенности СППР привели к тому, что данные, используемые для анализа, стали выделять в отдельные базы данных, получившие название хранилищ данных (ХД).
Концепция информационных хранилищ данных (первоначально она так и называлась — Information Ware House) зародилась в 80-х гг. XX в. в недрах корпорации IBM , но все же «отцом» технологии считается Билл Инмон, технический директор компании Prism.
- 1. Архитектура информационных таможенных систем 4
- Глава 2. Информационно-техническая политика 39
- Глава 3. Единая автоматизированная
- Глава 4. Базы информационных данных 69
- Глава 5. Программные продукты, используемые
- Глава 6. Основы компьютерных телекоммуникаций 134
- 1. Архитектура таможенных систем
- 1.2. Операционные системы
- 1.2.1. Назначение и функции операционной системы
- 1.2.2. Архитектура операционной системы
- 1.2.3. Процессы и потоки, мультипрограммирование
- 1.2.4. Мультипроцессорная обработка
- 1.2.5. Управление памятью
- 1.2.6. Кэш-память
- 1.2.7. Организация ввода-вывода
- 1.3. Файловые системы
- 1.3.1. Логическая и физическая организация файловой системы
- 1. Небольшой файл (small)
- 2. Большой файл (large)
- 3. Очень большой файл (huge)
- 4. Сверхбольшой файл (extremely huge)
- 1. Небольшие каталоги (small indexes)
- 2. Большие каталоги (large indexes)
- 1.3.2. Сравнительный анализ быстродействия файловых систем fat и
- 2. Информационно-техническая политика фтс россии
- 2.4. Концепция информационно-технической
- 2.4.1. Электронное декларирование
- 2.4.2. Система управления рисками
- 2.4.3. Система предварительного информирования
- 2.4.4. «Зеленый коридор»
- 2.4.5. Оценка эффективности реализуемой системы организационных
- 3. Единая автоматизированная
- 3.1. Задачи автоматизации процессов
- 3.4. Принципы построения еаис
- 3.6. Типовые требования по безопасности
- 4. Базы информационных данных
- 4.1. Основные понятия процесса
- 4.2. Системы управления базой
- 4.3. Особенности баз данных, используемых в фтс россии
- 4.3.1. Центральная база данных
- 4.4. Распределенные технологии
- 4.5. Принципы построения систем поддержки
- 4.6. Принципы построения систем, ориентированных
- 4.6.1. Хранилища данных
- 4.6.2. Модели данных, используемые для хранилищ
- 4.6.3. Методы аналитической обработки данных в хранилище
- 4.6.4. Хранилища данных в еаис
- 4.7. Case-тбхнологии при проектировании таможенных
- 5. Программные продукты, используемые в фтс россии. Функциональные автоматизированные
- 5.1. Средства автоматизации органов управления фтс
- 5.2. Функциональные арм и их взаимодействие
- 5.2.1. Понятие об автоматизированном рабочем месте
- 5.2.2. Арм участников вэд
- 5.3. Автоматизированная система контроля
- 5.4. Автоматизированная система пограничного
- 5.5. Комплексные средства автоматизации
- 5.5.1. Аист-рт21
- 5.5.2. «Аист м»
- 6. Основы компьютерных телекоммуникаций
- 6.1. Структура компьютерных сетей.
- 6.1.1. Линии связи
- 6.1.2. Аппаратура линий связи
- 6.1.3. Технологии объединения отдельных компьютеров в сеть
- 6.1.4. Организация совместного использования линий связи
- 6.1.5. Адресация компьютеров
- 6.2. Способы коммутации и передачи данных в сетях
- 6.3. Сетевая технология ethernet
- 6.4. Структуризация — средство построения
- 6.5. Сетевые технологии token ring, fddi
- 6.5.1. Сетевая технология Token Ring
- 6.5.2. Сетевая технология fddi