Проблемы интеграции данных
Любая крупная и давно существующая корпорация обладает несколькими базами данных, относящимися к разным видам деятельности. Данные могут иметь разные представления, а иногда могут быть даже несогласованными (например, из-за ошибки ввода в одну из БД). Это нехорошо даже для OLTP-систем и в принципе непригодно для OLAP-систем, которые должны обрабатывать общие исторические согласованные корпоративные данные. Более того, для оперативной аналитической обработки требуется привлечение внешних источников данных, которые тем более могут обладать разными форматами и требовать согласования. Подход к построению ХД для интеграции неоднородных источников данных принципиально отличается от подхода динамической интеграции разнородных БД. В случае ХД данных реально строится новое крупномасштабное ХД, управление данными в котором происходит, вообще говоря, по другим правилам, нежели в исходных оперативных БД. Основные проблемы реализации хранилищ данных Неоднородность программной среды ХД практически никогда не создается на пустом месте. Почти всегда конечное решение будет разнородным, т.е. в нем будут использоваться автономно разработанные программные средства. Прежде всего это касается формирования интегрированного согласованного набора данных, которые могут поступать из разнородных БД, электронных архивов, публичных и коммерческих электронных каталогов, справочников, статистических сборников. При построении ХД приходится решать задачу построения единой, согласованно функционирующей информационной системы на основе неоднородных программных средств и решений. При выборе средств реализации ХД приходится учитывать множество факторов, включающих уровень совместимости различных программных компонентов, легкость их освоения и использования, эффективность функционирования и т.д. Распределенный характер организации В концепции ХД предопределено то, что операционная аналитическая обработка может выполняться в любом узле сети независимо от места расположения основного хранилища. Хотя при аналитической обработке данные только читаются, и потребность в синхронизации отсутствует, для достижения эффективности необходимо поддерживать репликацию данных в разных узлах сети. (На самом деле, все не так просто. Одним из требований к хранилищам данных является то, чтобы свежая информация поступала в ХД как можно быстрее. Т.е. потенциально любая модификация оперативной БД может инициировать добавление данных к хранилищу данных, а тогда потребуется обновить и все реплики, для чего синхронизация все-таки нужна.) Повышение требований к безопасности данных Собранная вместе согласованная информация об истории развития корпорации, ее успехах и неудачах, о взаимоотношениях с поставщиками и заказчиками, об истории и состоянии рынка дает возможность анализа прошлой и текущей деятельности корпорации и построения прогнозов для будущего. Эта информация настолько ценна для корпорации, что нельзя допустить возможности ее утечки (на самом деле, если ХД одной корпорации попадет в руки аналитиков другой корпорации, то все аналитические прогнозы первой корпорации сразу станут неверными). В системах, основанных на хранилищах данных, оказывается недостаточной защита данных в стиле языка SQL, которую обеспечивают обычные коммерческие СУБД. Для обеспечения должного уровня защиты доступ к данным должен контролироваться не только на уровне таблиц и их столбцов, но и на уровне отдельных строк. Приходится также решать вопросы аутентификации пользователей, защиты данных при их перемещении в ХД из оперативных БД и внешних источников, защиты данных при их передаче по сети Необходимость наличия многоуровневых справочников метаданных Если роль метаданных (обычно содержащихся в таблицах-каталогах) в оперативных информационных системах достаточно ограничена, то для OLAP-систем наличие развитых метаданных и средств их предоставления конечным пользователям является одним из основных условий успешной реализации. Например, прежде, чем менеджер корпорации задаст системе свой вопрос, он должен понять, какая информация имеется, насколько она актуальна, можно ли ей доверять, сколько времени может занять формирование ответа и т.д. Для пользователя OLAP-системы требуются метаданные, по крайней мере, следующих типов. Типы метаданных для пользователя OLAP-системы
Потребность в эффективном хранении и обработке очень больших объемов информации Уже сейчас известны примеры ХД, содержащих терабайты информации. По данным консалтинговой компании Meta Group , около половины корпораций, использующих или планирующих использовать ХД, предполагает довести их объем до сотен гигабайт. Проблемой таких больших хранилищ является то, что накладные расходы на внешнюю память возрастают нелинейно при возрастании объема хранилища. Исследования, проведенные на основе тестового набора TPC-D, показали, что для БД объемом в 100 гигабайт потребуется внешняя память объемом в 4.87 раза большая, чем нужно собственно для полезных данных. При дальнейшем росте БД этот коэффициент увеличивается. Реализация хранилищ и витрин данных Варианты реализации ХД
|
- Области применения ит - информационных технологий
- Современные ит - информационные технологии
- Цели внедрения информационных технологий
- Этапы развития ит (информационных технологий)
- Информационная система
- Общие понятия об информационных системах - ис
- Основные задачи информационных систем - ис
- Пользователи информационных систем - ис
- Процессы в информационных системах - ис
- Система. Общие понятия о системе
- Современные информационные системы - ис
- Этапы развития информационных систем - ис
- Математическое и программное обеспечение информационных систем - ис
- Организационное обеспечение информационных систем - ис
- Правовое обеспечение ис - информационных систем
- Техническое обеспечение информационной системы - ис.
- Принципы и методы создания ис - информационных систем
- Методы и концепции создания ис - информационных систем
- Принципы создания информационных систем - ис
- Классификация информационных систем - ис
- Классификация ис по масштабности применения
- Классификация ис по концепции построения
- Классификация ис по оперативности обработки данных
- Классификация ис по признаку структурированности задач
- Классификация ис по сфере деятельности
- Классификация информационных систем по режиму работы
- Классификация информационных систем по степени автоматизации
- Классификация информационных систем по функциональности
- По квалификации персонала и управления
- По характеру обработки информации
- Аналитические ис репортинга, oltp, data mining
- Общие сведения об аналитических ис репортинга, oltp, data mining
- Базовая аналитическая система
- Классификация по области применения
- Классы аналитических систем
- Перспективы использования аналитических систем
- Применяемые виды анализа
- Системы репортинга
- Рынок систем репортинга
- Oltp - системы оперативной обработки транзакций
- Data Mining (dm) - интеллектуальный анализ данных
- Типы закономерностей
- Классы систем Data Mining - dm
- Алгоритмы ограниченного перебора
- Генетические алгоритмы
- Деревья решений (decision trees)
- Нейронные сети
- Предметно-ориентированные аналитические системы
- Системы для визуализации многомерных данных
- Системы рассуждений на основе аналогичных случаев
- Статистические пакеты
- Эволюционное программирование
- Бизнес-приложения Data Mining
- Банковское дело
- Медицина
- Молекулярная и генная инженерия
- Розничная торговля
- Страхование
- Телекоммуникации
- Проблемы, связанные с использованием Data Mining dm-технологии
- Olap-системы оперативной аналитической обработки данных
- Недостатки olap
- Основные преимущества olap-систем
- Предпосылки и причины появления olap
- Принципы проектирования и использования многомерных бд
- Типы используемых данных
- Многомерная модель данных
- Гиперкубические и поликубические модели данных
- Операции с измерениями
- Требования к olap-средствам
- 12 Основных правил olap- систем по Кодду
- Fasmi Пендса и Крита
- Кубы olap
- Спуск и консолидация
- Члены и метки. Иерархии. Аналитические операции.
- Классификация olap по типу доступа к бд
- Достоинства и недостатки rolap
- Метаданные
- Другие olap. Holap. Dolap. Jolap.
- По месту размещения olap - машин
- Olap-клиент
- Olap-сервер
- Применение olap - систем
- Преимущества и недостатки
- Определение dss (сппр)
- Характеристики dss (сппр)
- Структура сппр
- Бм и субм
- Классификация
- Основные функции субм
- Система управления интерфейсом
- Управление сообщениями. Электронная почта.
- Data Warehouse – хранилище данных - хд - систем обработки данных
- Цели и задачи хранилищ данных
- Концепция хд - хранилища данных
- Единый источник даннх
- Свойства данных
- Структура ис на основе хд
- Методы организации хд
- Data Mart - Витрины данных
- Интегрированное хд - хранилище данных
- Непроектируемые витрины данных
- Система постепенно развиваемых витрин данных
- Data Warehouse Bus - хд с архитектурой шины
- Объединенное (федеративное) хд
- Требования к техническому и программному обеспечению
- Основные компоненты хд
- Проблемы интеграции данных
- Сравнение оперативных и аналитических бд
- Средства и методы построения хд - хранилищ данных
- Применение готовых хранилищ данных
- Студии для построения хд - хранилищ данных
- Подход сверху вниз
- Подход снизу вверх
- Рекомендации по внедрению хд
- Финансовые хранилища данных (хд)
- Хд для управления человеческими ресурсами
- Хранилища данных (хд) в области телекоммуникаций
- Хранилища данных (хд) с возможностями Data Mining и Exploration
- Хранилища данных в области страхования
- Тенденции развития хранилищ данных
- Операции и процедуры
- Функции управления
- Принципы управления
- Информационные технологии и системы управления
- Информационные технологии управления
- Информационные системы управления (ису)
- Виды обеспечений в составе иасу
- Уровни управления
- Ис организационного управления (исоу)
- Ису "Галактика"
- Система управления Парус
- Корпоративные информационные системы - кис
- Определения и назначения кис
- Перспективы развития корпоративных информационных систем (кис)
- Современные корпоративные информационные системы
- Структура корпоративных информационных систем
- Требования к корпоративным базам данных
- Требования к техническому обеспечению кис
- Кис и Internet, Intranet-технологии
- Особенности создания кис на базе Workflow-систем
- Системы управления документами - суд
- Средства обработки бумажных документов
- Мировой рынок корпоративных информационных систем
- Экспертные интеллектуальные ис (информационные системы)
- Структура и типы сии
- Терминология систем искусственного интеллекта
- Эволюция экспертных систем
- Второе поколение экспертных интеллектуальных систем (эис)
- Первое поколение экспертных систем
- Третье поколение экспертных интеллектуальных систем (эис)
- Назначение экспертных интеллектуальных систем (эис)
- Структура экспертных интеллектуальных систем
- База знаний (бз). Правила.
- Интерфейс пользователя - диалог с экспертной системой
- Решатель (интерпретатор, дедуктивная машина)
- Виды знаний в экспертных системах
- Организация знаний в базе данных
- Уровни представления и уровни детальности
- Особенности разработки экспертных интеллектуальных систем
- Технология разработки экспертных интеллектуальных систем
- Основные компоненты ис офисной автоматизации
- Ис управления бизнес-процессами
- Определение вмр( управление бизнес-процессами)
- Примеры использования вмр(Business Performance Management)
- Ис банковской деятельности
- Программно-техническая платформа абс(автоматизированной банковской системы)
- Функциональная структура абс (автоматизированной банковской системы)
- Районный уровень статистичекой службы Украины
- Региональный (областной) уровень статистичекой службы Украины
- Центральный (государственный) уровень статистичекой службы Украины
- Ис в налоговых органах Украины
- Автоматизированная информационная система (аис) «Налоги»
- Ис(информационная система) в страховании
- Функциональные подсистемы аис «Страхование»
- Информационное обеспечение системы страхования
- Ис(информационные системы) управления персоналом
- Функциональная направленность систем управления персоналом
- Эффекты от внедрения hr-систем управления персоналом
- Ис(информационные системы) на основе производственных стандартов
- Эволюция стандартов планирования производства
- Стандарт mrp II (Manufacturing Resource Planning)
- Подробнее об mrp1 - стандарте планирования материальных ресурсов
- Входные элементы mrp-системы
- Основные операции, достоинства и недостатки mrp-системы
- Преимущества и процесс планирования mrp-систем
- Принцип работы mrp-системы и результаты работы
- Требования к производству для успешного внедрения mrp-системы
- Цели и задачи системы-mpr
- Процесс crp(Capacity Requirements Planning)
- Входные данные crp(Capacity Requirements Planning)
- Значение crp(Capacity Requirements Planning)
- Подробнее о mrpii - стандарте планирование производственных ресурсов
- Процессы mprii
- Цели и задачи системы-mprii
- Функциональные блоки mrp II
- Планирование потребностей в сырье и материалах
- Главный календарный план производства
- Инструментальное обеспечение
- Интерфейс с финансовым планированием
- Оценка деятельности ( Performance Measurement ) в mrp II
- Планирование продаж и операций
- Планирование ресурсов распределения
- Управление входным и выходным материальным потоком в mrp II
- Преимущества mprii
- Концепция erp-системы
- Структура erp - системы
- Общая характеристика erp
- Преимущества erp - системы
- Csrp - стандарт(Customer Synchronized Resource Planning) и система
- Современная концепция управления ресурсами csrp
- Преимущества csrp
- Жизненный цикл - общие понятия
- Жизненный цикл изделия (жци)
- Этапы жци
- Классификация данных в связи со стадиями жци
- Маркетинг и исследование жизненного цикла.
- Разработка-производство жц
- Этапы жц промышленных изделий и системы их автоматизации
- Жизненный цикл ис
- Жизненный цикл производственных ис
- Cals-методология поддержки жц ис
- Cals-стратегия
- Cals-технологии
- Базовые принципы cals-технологии
- Безмужаное представление информации
- Виртуальное производство
- Интегрированная информационная среда cals
- Концепция cals
- Параллельный инжиниринг
- Реинжиниринг бизнес-процессов
- Системы cals
- Управление процессами
- Стандарты cals
- Другие стандарты cals
- Стандарт iso 10303 (step)
- Стандарт iso 13584 (p_lib) и семейство стандартов idef
- Применение cals