5.2 Масштабируемость и другие характеристики корпоративных баз данных. Хранилища данных.
Отмечалось, что системы управления базами данных применяются во всех отраслях промышленности, причем доминирующим типом систем являются реляционные СУБД. Эти системы проектировались для управления большим потоком транзакций, каждая из которых сопровождалась внесением небольших изменений в оперативные данные предприятия, т.е. в данные, которые предприятие обрабатывало в процессе своей повседневной деятельности. Системы подобного типа называются системами оперативной обработки транзакций, илисистемами OLTP (On-Line Transaction Processing). Размер баз данных для систем OLTP может изменяться от совсем небольшого, всего в несколько мегабайтов, до среднего, порядка нескольких гигабайтов, и дальше, вплоть до очень большого, на уровне нескольких терабайтов или даже петабайтов. СУБД должна одинаково эффективно управлять базой данных независимо от ее объема. Эта ее характеристика называетсямасштабируемостью.
Широко известные методы проектирования баз данных (БД) появились в процессе разработки все более сложных Информационных Систем (ИС), которые должны были рассматривать потребности не одного пользователя, но больших групп и коллективов. Одна такая интегрированнаяБД создавалась для решения многих задач, каждая из которых использовала только "свою" часть данных, обычно, пересекающуюся с частями, используемыми в других задачах. Сформировалось понимание интегрированной БД как общего информационного ресурса предприятия. Хранимые данные стали аналогичны большому компьютеру, который одновременно используется многими пользователями с различными целями и должен быть все время работоспособен.
ПереносимостьБД. База данных может быть реализована на платформах разных типов компьютеров, операционных систем, СУБД и даже моделей данных, и, при необходимости, переноситься с одной платформы на другую.
Возможность переносимости баз данных позволяет подключать базы данных на любой сервер одной организации. Переносимость баз данных реализуется по следующим причинам:
Повышенная надежность благодаря устранению ручных этапов в процедурах аварийного восстановления, которые отличаются высокой вероятностью возникновения ошибки.
В сценарии утраченного кластеризованного сервера требуется выполнить аварийное восстановление этого сервера, чтобы клиентские компьютеры могли получить доступ к базам данных, расположенным на этом сервере.
Данные в базах данных корпоративной информационной системы не должны зависеть от сервера, поэтому доступ к ним также не должен быть зависимым от сервера.
Переносимость баз данных сокращает срок полного аварийного восстановления в различных сценариях аварийного восстановления.
Хранилища данных.Начиная с 1970-х годов организации были более заинтересованы во вложении своих средств в новые компьютерные системы, чем в автоматизацию используемых ими деловых процессов. Это позволяло им повысить свою конкурентоспособность за счет развертывания систем, которые могли предоставить клиентам более эффективный и менее дорогостоящий набор услуг. С тех пор организации накопили огромное количество информации, которая хранится в их оперативных базах данных. И теперь, в связи с широким распространением систем поддержки принятия решений, организации стремятся сконцентрировать свое основное внимание на способах использования накопленных оперативных данных в этих системах, имея целью получить за счет этого дополнительный рост своей конкурентоспособности.
Лицам, ответственным за принятие корпоративных решений, необходимо иметь доступ ко всем данным организации независимо от их расположения. Для выполнения полного анализа деятельности организации, определения ее деловых показателей, выяснения характеристик существующего спроса и тенденций его изменения необходимо иметь доступ не только к текущим данным, но и к ранее накопленным (историческим) данным.
Прежние системы оперативной обработки проектировались без учета какой-либо поддержки подобных деловых требований, поэтому преобразование обычных систем OLTP в системы поддержки принятия решений оказалось чрезвычайно сложной задачей.
Как правило, типичная организация имеет множество различных систем операционной обработки с перекрывающимися, а иногда и противоречивыми определениями, например с разными типами, выбранными для представления одних и тех же данных. Основной задачей организации является преобразование накопленных архивов данных в источник новых знаний, причем таким образом, чтобы пользователю было предоставлено единое интегрированное и консолидированное представление о данных организации.
Для решения этой хадачи была разработана концепция хранилища данных (dataWareHouse). Концепция хранилища данных была задумана как технология, способная удовлетворить требования систем поддержки принятия решений, и базирующаяся на информации, поступающей из нескольких различных источников оперативных данных, функционирующих под управлением разных операционных модулей, Кроме того, в хранилище данных содержатся также различные накопительные и сводные данные.
Концепция хранилища данных базируется на усовершенствованной технологии баз данных и предусматривает специальные средства управления процессом хранения информации.
Однако лицам, ответственным за принятие корпоративных решений, необходимо иметь мощные инструменты анализа накопленных данных. Основными средствами анализа в последние годы стали инструменты оперативной аналитической обработки (On-Line Analytical Processing — OLAP) и инструменты разработки данных (data mining).
Хранилище данных ─ это предметно-ориентированный, интегрированный, привязанный ко времени и неизменяемый набор данных, предназначенный для поддержки принятия решений.
В приведенном выше определении указанные характеристики данных рассматриваются следующим образом.
• Предметная ориентированность. Хранилище данных организовано вокруг основных предметов (или субъектов) организации (например, клиенты, товары и сбыт), а не вокруг прикладных областей деятельности (выставление счета клиенту, контроль запасов и продажа товаров). Это свойство отражает необходимость хранения данных, предназначенных для поддержки принятия решений, а не обычных оперативно-прикладных данных.
• Интегрированность. Смысл этой характеристики состоит в том, что оперативно-прикладные данные обычно поступают из разных источников, которые часто имеют несогласованное представление одних и тех же данных, например используют разный формат. Для предоставления пользователю единого обобщенного представления данных необходимо создать интегрированный источник, обеспечивающий согласованность хранимой информации.
• Привязка ко времени. Данные в хранилище точны и действительны только в том случае, если они привязаны к некоторому моменту или промежутку времени. Необходимость привязки хранилища данных ко времени следует из большой длительности того периода, за который была накоплена сохраняемая в нем информация, из явной или неявной связи временных отметок со всеми сохраняемыми данными, а также из того факта, что хранимая информация фактически представляет собой набор снимков состояния данных.
• Неизменяемость. Это означает, что данные не обновляются в оперативном режиме, а лишь регулярно пополняются за счет информации из оперативных систем обработки. При этом новые данные никогда не заменяют, а лишь дополняют прежние. Таким образом, база данных хранилища постоянно пополняется новыми данными, последовательно интегрируемыми с уже накопленной информацией.
В последние годы тематика хранилищ данных обогатилась новым термином — сетевое хранилище данных. Сетевое хранилище данных – распределенное хранилище данных, реализованное в среде Web и не имеющее центрального репозитория данных.
Преимущества технологии хранилищ данных:
Потенциально высокая отдача от инвестиций
Повышение конкурентоспособности
Повышение эффективности труда лиц, ответственных за принятие решений
- Г.Г. Волков, о.Ю. Глинский
- Тема 9. Проектирование кис. 74
- Тема 1. Предмет и основные понятия корпоративных информационных систем.
- 1.1 Компьютерные информационные технологии в управлении экономическим объектом. Классификация систем управления.
- 1.2 Понятие информационной системы
- 1.3 Корпоративные информационные системы. Принципы организации корпоративных информационных систем.
- 1.4. Корпоративные информационные технологии. Технологии клиент/сервер. Управление распределенными вычислениями.
- 1.5. Структура корпоративной информационной системы. Требования к кис.
- Тема 2. Информационные ресурсы корпоративных информационных систем
- 2.1 Источники информации в информационной системе. Информационные модели объекта правления. Информационные массивы и потоки.
- 2.2 Информационное обеспечение корпоративных информационных систем.
- 2.3 Информационные ресурсы. Роль информационных ресурсов в управлении экономикой. Информационные ресурсы Республики Беларусь.
- Тема 3. Техническое обеспечение систем обработки экономической информации
- 3.1 Технические средства корпоративных информационных систем, их классификация
- 3.2 Технические средства автоматизации производственных процессов.
- 3.3 Системное программное обеспечение. Переносимость, масштабируемость, мобильность, режимы обработки информации и другие характеристики операционных систем. Стандарты в области операционных систем.
- 3.4 Операционная среда.
- Тема 4. Сетевое обеспечение корпоративных информационных систем.
- 4.1 Корпоративные сети. Характеристики корпоративных компьютерных сетей.
- 4.2 Администрирование компьютерных сетей.
- 4.3 Internet/Intranet в корпоративных информационных системах.
- 4.4 Развитие телекоммуникационных и сетевых технологий.
- Тема 5. Корпоративные базы данных
- 5.1 Корпоративные базы данных. Основные требования к базам данных в рамках корпоративных информационных систем.
- 5.2 Масштабируемость и другие характеристики корпоративных баз данных. Хранилища данных.
- 5.3 Субд и структурные решения в корпоративных системах.
- 5.4 Технологии Internet/Intranet и корпоративные решения по доступу к базам данных.
- Тема 6. Прикладное программное обеспечение в корпоративных информационных системах
- 6.1 Обеспечение совместимости программного обеспечения в корпоративных системах.
- 6.2 Открытость, модульность, мобильность и масштабируемость программного обеспечения.
- 6.3 Концепции управления компьютеризированными предприятиями. Cio-менеджмент на современном предприятии.
- 6.4 Mrp-системы. Erp-системы. Crm-системы.
- 6.5 Электронный бизнес, его классификация. Геоинформационные системы в экономике.
- 6.6 Стандартизация и сертификация прикладного программного обеспечения.
- Тема 7. Системы искусственного интеллекта.
- 7.1 Направления использования систем искусственного интеллекта (ит).
- 7.2 Математические модели и аппаратно-программная реализация систем ии.
- 7.3 Понятие и назначение экспертной системы (эс). Классификация эс.
- Экспертные системы имеют дело с предметами реального мира, операции с которыми обычно требуют наличия значительного опыта, накопленного человеком.
- Экспертная система должна за приемлемое время (достаточно малое) найти решение, которое было бы не хуже, чем то, которое может предложить специалист в этой предметной области.
- 7.4 Понятие системы поддержки принятия решений (сппр).
- Тема. 8. Обеспечение безопасности корпоративных информационных систем.
- 8.1 Понятие информационной безопасности.
- 8.2 Угрозы безопасности. Факторы угроз.
- 8.3 Понятие компьютерной преступности. Этапы развития компьютерной преступности.
- 8.4 Программно-техническое обеспечение безопасности информационных систем.
- 8.5 Организационно-экономическое обеспечение безопасности информационных систем.
- 8.6 Правовое обеспечение безопасности информационных систем.
- Глава V состоит из 6 статей: 22-27.
- Тема 9. Проектирование кис.
- 9.1 Жизненный цикл кис. Модели жизненного цикла кис: каскадная, спиральная.
- 9.2 Этапы проектирования кис.
- 9.3 Реинжиниринг бизнес-процессов.
- 9.4 Моделирование бизнес-процессов.
- 9.5 Обзор систем автоматизированного проектирования кис. Case-технологии.
- Вопросы к экзамену
- Литература