20. Развитие технологий баз данных: банки данных, хранилища данных, базы знаний.
Банк данных (data bank) - автоматизированная информационная система централизованного хранения и коллективного использования данных. В состав банка данных входят одна или несколько баз данных, справочник баз данных, СУБД, а также библиотеки запросов и прикладных программ.
Банк данных - важнейшая часть АСУ, систем автоматизированного проектирования (САПР), различных информационных систем (медицинских, библиотечных и др.).
Хранилище данных (data warehouse) — это автоматизированная информационно-технологическая система, которая собирает данные из существующих баз и внешних источников, формирует, хранит и эксплуатирует информацию как единую. Оно обеспечивает инструментарий для преобразования больших объемов детализированных данных в форму, которая удобна для стратегического планирования и реорганизации бизнеса и необходима специалисту, ответственному за принятие решений. При этом происходит слияние из разных источников различных сведений в требуемую предметно-ориентированную форму с использованием различных методов анализа.
Особенность новой технологии в том, что она предлагает среду накопления данных, которая не только надежна, но по сравнению с распределенными СУБД и оптимальна в отношении доступа к данным и манипулирования ими.
Хранилище информации предназначено для хранения, оперативного получения и анализа интегрированной информации по всем видам деятельности организации.
Данные в таком хранилище характеризуются следующими свойствами:
- предметная ориентация — данные организованы согласно предмету, а не приложению (в соответствии со способом их применения);
- интегрированность — данные согласуются с определенной системой наименований, хотя могут принадлежать различным источникам и их формы представления могут не совпадать;
- упорядоченность во времени — данные согласуются во времени для использования в сравнениях, трендах и прогнозах;
- неизменяемость и целостность — данные не обновляются и не изменяются, а только перезагружаются и считываются, поддерживая концепцию «одного правдивого источника».
- большой объем и сложные взаимосвязи данных.
К основным категориям данных, которые располагаются в хранилище, относятся: метаданные, описывающие способы извлечения информации из различных источников, методы их преобразования из различных структур и форматов и доставки в хранилище; фактические данные (архивы), отражающие состояние предметной области и конкретные моменты времени; суммарные данные, полученные на основе проведенных аналитических расчетов.
В информационных хранилищах используются статистические технологии, генерирующие информацию об информации; процедуры суммирования; методы обработки электронных документов, аудио-, видеоинформации, графов и географических карт.
Для уменьшения размера информационного хранилища до минимума при сохранении максимального количества информации применяются эффективные методы сжатия данных.
Для преобразования данных из хранилища в предметно-ориенти-рованную форму требуются языки запросов нового поколения. Руководителям организации данные доступны посредством SQL-запросов, инструментов создания интерактивных отчетов на экране, бсшее развитых систем поддержки принятия решений, многомерного просмотра данных посредством гипертекстовой технологии.
База знаний (knowledge base)— это особого рода база данных, разработанная для оперирования знаниями (метаданными). База знаний содержит структурированную информацию, покрывающую некоторую область знаний, для использования кибернетическим устройством (или человеком) с конкретной целью. Современные базы знаний работают совместно с системами поиска информации, имеют классификационную структуру и формат представления знаний.
Полноценные базы знаний содержат в себе не только фактическую информацию, но и правила вывода, допускающие автоматические умозаключения о вновь вводимых фактах и, как следствие, осмысленную обработку информации. Область наук об искусственном интеллекте, изучающая базы знаний и методы работы со знаниями, называется инженерией знаний.
Иерархический способ представления в базе знаний набора понятий и их отношений называется онтологией. Онтологию некоторой области знаний вместе со сведениями о свойствах конкретных объектов также можно назвать базой знаний.
- 1. Проблема нормализации отношений. Нормальные формы. Способ нормализации отношений.
- 2. Понятие базы данных и субд. Платформы субд.
- 3. Технологии поиска данных (на примере платформы Sybase).
- 4. Применение ключей в субд.
- 5. Правила Джексона и их применение.
- 6. Технологии поддержки целостности в базах данных.
- 7. Реляционная модель данных. Понятие отношения. Свойства отношений. Операции над отношениями.
- Операции, определённые над отношениями
- 8. Функциональные зависимости на отношениях и их применение.
- Применение в проектировании бд
- 9. Технология olap и ее применение. Архитектура olap-системы
- 10. Многомерная модель данных olap.
- 11. Язык PowerScript: характеристики, возможности программирования.
- 12. Понятие отношения и его применение. Операции на отношениях.
- 13. Технология DataWindow: назначение, состав, примеры применения.
- 14. Объектная модель в инструментальной субд на примере Power Builder.
- 15. Проектирование Web – приложений в трехслойной архитектуре “клиент - сервер”.
- 16. Жизненный цикл субд. Модели жц. Технологии поддержки жизненных циклов.
- 17. Технологии «клиент-сервер» управления данными
- 18. Оператор select sql.
- 19. Концептуальное моделирование баз данных. Модель "сущность-связь" и ее применение.
- 20. Развитие технологий баз данных: банки данных, хранилища данных, базы знаний.
- 21. Правила Джексона и их применение.
- 22. Функциональные зависимости на отношениях и их применение.
- 23. Ссылочная целостность баз данных.
- 24. Модели данных баз данных.
- 25. Этапы проектирования баз данных: состав, назначение, модели.
- 26. Возвращаемые аргументы в технологии DataWindow.
- 27. Состав современных баз данных: объекты, их назначение, примеры применения.
- 28. Реляционная алгебра: определение, операции, применение.
- 29. Оператор update sql
- 30. Разработка веб-приложений, включающих субд.
- 31. Оператор insert sql
- 32. Обработка ошибок в субд
- 33. Оператор delete sql.
- 34. Принципы и средства разработки Web – интерфейсов.
- 35. Нормальная форма Бойса-Кодда.
- 36. Реляционное исчисление: определение, операции, применение.