8.2. Модели данных
Модель и подмодель данных. Банк данных хранит информацию об объектах реального мира и отношения между этими объектами через данные и связи между этими данными. Прежде чем говорить о размещении данных и связей между ними на устройствах памяти, необходимо представить взаимосвязь данных на логическом уровне, создав своеобразную модель данных.
Эта модель данных должна быть четко определена, для чего в системе управления базами необходимо представить средства (язык) для ее описания. Основное назначение модели данных состоит в том, чтобы дать возможность представить в целом информационную картину без отвлекающих деталей, связанных с особенностями хранения. Она является инструментом, с помощью которого разрабатывается стратегия получения любых данных, хранящихся в банке.
Термином подмодель определяют описание данных, используемое при прикладном программировании. На основе единой модели можно составить множество различных подмоделей. Теоретически они могут сильно отличаться от общей модели данных. Принципиально здесь то, что можно указать алгоритм, с помощью которого данные со структурой подмодели получаются из базы данных, построенной в соответствии с моделью.
Рассмотрим иерархическую, сетевую и реляционную модели данных. Можно считать, что в некотором смысле эта последовательность отражает прогресс в понимании проблем обработки данных. Однако начнем рассмотрение их все-таки с сетевой модели, так как она наиболее наглядно отражает отношения объектов проблемной области.
Сетевая модель данных. Отношения объектов реального мира могут быть представлены в виде некоторой сети. Это представление рисует довольно наглядную картину реальной действительности и, кроме того, претендует на то, что может быть естественным образом отражено в долговременной памяти вычислительной системы. .
Каждый узел сети соответствует элементу данных, отображают группу однородных объектов реального мира. Тогда в реальной или, как говорят, экземпляре сети в каждом узле будет находится идентификатор соответствующего объекта, например шифр.
На самом деле представлять и рисовать сеть на таком уровне детализации достаточно трудно. Поэтому в вершинах сети обычно стоят записи, состоящие из совокупности идентификаторов. Например в вершине сети, имеющей имя деталь фактически стоит запись, состоящая из полей шифр детали, наименование детали.
Иерархическая модель данных. Более удобного представление данных можно достигнуть за счет увеличения информационной избыгочности на уровне модели данных. Шагом на пути к увеличению информационной избыточности является переход от сетевого к иерархическому представлению данных. Такая возможность опирается
на тот факт, что сеть можно представить в виде совокупности деревьев. Для этого в иерархических структурах требуется повторить и только преобразовать некоторые вершины сети.
Если на уровне сети, не вдаваясь в подробности физического хранения данных, база данных представляется в виде сложной объемной рутины, то на уровне иерархической модели базы данных представятся в виде совокупности отдельных древовидных структур, в корнях которых стоят идентификаторы объектов, а на последующих ярусах раскрываются свойства этих объектов.
Таким образом, по крайней мере на уровне логического представления некоторые отношения и связи реального мира имитируются с помощью информационной избыточности.
Это еще не значит, что информационная избыточность будет реальной, т.е. будет иметь место и на уровне физического отображения на долговременную память. Такое видение мира более удобно с точки зрения обработки данных.
Следовательно, сетевые модели данных могут быть разложены на иерархические структуры. Однако следует отметить, что модель данных, представленная как совокупность нескольких деревьев, не обладает наглядностью, так как не создается впечатления некоторой взаимосвязанной системы данных. Вообще говоря, одновременно с использованием деревьев для описания модели данных неплохо представлять себе модель данных в виде сети, с тем, чтобы ясно понимать, как с ней взаимодействуют иерархические структуры.
Сетевая модель, если она не очень громоздка, позволяет графически представить взаимодействие объектов, отображенных в базе данных. Это всегда полезно, даже если затем для описания используются иные структуры.
Реляционная модель данных. Наиболее абстрактной моделью является реляционная модель данных. Абстрактна она в том смысле, что в значительной степени ориентирована на интересы пользователя (программиста) и совершенно не несет в себе черт реального отображения на физическую память. Эта модель исторически возникла позже других, и ее появление оправдывается тем, что по мере усложнения информационных систем и прогресса в устройствах долговременной памяти поддержание математического обеспечения, несущего в себе черты <суеты представления>, обходится очень дорого.
Реляционная модель получается путем дальнейшей формализации иерархической модели. В этой модели все связи между объектами задаются путем явной фиксации идентификаторов объектов в записях.
На первый взгляд реляционная модель может быть представлена в виде однородных таблиц (отношений), которые напоминают стандартные последовательные файлы. Однако это очень упрощенная точка зрения. Дело в том, что последовательный файл предполагает определенную упорядоченность и обработку в соответствии с этой упорядоченностью, или, иными словами, предполагается вход со стороны одного поля (ключа сортировки).
Существенное отличие реляционной модели от обыкновенного последовательного файла заключается в том, что все столбцы в таблице с точки зрения входа предполагаются эквивалентными. Именно это свойство делает эту модель весьма мощной и делает невозможным отображение ее на память в виде последовательного массива данных.
Информационная избыточность, по крайней мере на логическом уровне, максимальная. Однако повторим еще раз: это не предполагает реальной информационной избыточности при отображении данных на физическую память.
На физическом уровне, например, может быть абсолютно неизбыточная сеть или сеть с перекрестными связями. Задача системы управления базой данных заключается в том, чтобы перевести запрос, сформулированный в терминах реляционной модели, в последовательность команд, осуществляющих поиск по сети.
Таким образом, реляционная модель предполагает очень высокую степень <интеллектуальности> систем управления базой данных.
Система управления базами данных. Является составной частью автоматизированного банка данных и обеспечивает работу прикладных программ с базой данных.
Одним из важнейших назначений СУБД является обеспечение независимости данных. Под этим термином понимается независимость данных и использующих их прикладных программ друг от друга в том смысле, что изменение одних не приводит к изменению других. Необходимо также отметить такие возможности СУБД, как обеспечение защиты и секретности данных, восстановление баз данных после сбоев, ведение учета работы с базами данных. Однако это является неполным перечнем того, что должна осуществлять СУБД для обеспечения интерфейса пользователей с базами данных и жизнеспособности всего автоматизированного банка данных. Система управления данными имеет набор средств, которые обеспечивают определенные способы доступа к данным. Наиболее общими операциями, которые выполняются средствами СУБД, является операции поиска, исправления, добавления и удаления данных. Необходимо отметить, что операция поиска является главной среди указанных.
Степень реализации принципа независимости данных определяет гибкость системы управления базами данных. Учет особенностей обработки данных в какой-либо предметной области позволяет спроектировать специализированные СУБД, ориентированные на применение в АСУ предприятий с дискретным характером производства.
Существуют и универсальные системы управления базами данных, используемые для различных приложений. При настройке универсальных СУБД для конкретных приложений они должны обладать соответствующими средствами. Процесс настройки СУБД на конкретную область применения называется генерацией системы. К универсальным системам управления базами данных относятся, например, системы dBase, Paradox, Microsoft Access, MS DOS, UNIX, Windows, Oracle.
- Глава 4 информационные ресурсы и информатизация общества 64
- Раздел II прикладная информатика 82
- Глава 5. Общая характеристика процессов сбора, передачи, обработки и хранения информации 82
- Глава 6. Технические средства реализации информационных процессов 105
- Глава 11 глобальная информационная сеть internet 222
- Глава 12 искусственный интеллект 270
- Глава 13 экспертные системы 297
- Острейковский в.А. Информатика
- Введение
- Раздел I теоретическая информатика глава 1 основные понятия и определения информатики
- 1.1. Терминология информатики
- 1.2. Объект информатики
- 1.3. Предметная область информатики как науки
- 1.4. Краткая история развития информатики
- Контрольные вопросы
- Глава 2 информатика как наука
- 2.1. Категории информатики
- 2.2. Аксиоматика информатики
- 2.3. Виды и свойства информации
- Контрольные вопросы
- Глава 3. Математические основы информатики
- 3.1. Методы и модели оценки количества информации
- 3.2. Основные понятия теории алгоритмов
- 3.3. Системы счисления
- 3.3.1. Позиционные системы счисления
- 3.3.2. Двоичная система счисления
- 3.3.3. Другие позиционные системы счисления
- 3.3.4. Смешанные системы счисления
- 3.3.5. Перевод чисел из одной системы счисления в другую
- 3.4. Формы представления и преобразования информации
- 3.4.1. Числовая система эвм. Представление целых чисел без знака и со знаком
- 3.4.2. Индикаторы переноса и переполнения
- 3.4.3. Представление символьной информации в эвм
- 3.4.4. Форматы данных
- Контрольные вопросы, упражнения и задачи
- Глава 4 информационные ресурсы и информатизация общества
- 4.1. Особенности информационного ресурса
- 4.2. Формы и виды информационных ресурсов
- 4.3. Информатизация общества
- 4.3.1. Сущность и цели информатизации
- 4.3.2. Создание информационных структур
- 4.3.3. Формирование индустрии информатики
- 4.3.4. Развитие интеллектуального и информационного рынков
- 4.4. Перспективы перехода к информационному обществу
- Контрольные вопросы
- Раздел II прикладная информатика глава 5. Общая характеристика процессов сбора, передачи, обработки и хранения информации
- 5.1. Восприятие информации
- 5.2. Сбор информации
- 5.3. Передача информации
- 5.4. Обработка информации
- Контрольные вопросы
- Глава 6. Технические средства реализации информационных процессов
- 6.1. Определение и принципы организации информационных процессов в вычислительных устройствах
- 6.2. Функционирование эвм с шинной организацией
- 6.3. Функционирование эвм с канальной организацией
- 6.4. Информационная модель эвм
- 6.5. Основные команды эвм
- 6.6. Персональные эвм
- 6.6.1. Общие сведения о пэвм и их классификация
- 6.6.2. Структурная схема пэвм
- 6.6.3. Внешние устройства пэвм
- 6.6.4. Внешние запоминающие устройства пэвм
- 6.6.5. Печатающие устройства пэвм
- 6.6.6. Перспективы развития пэвм
- 6.7. Вычислительные системы
- 6.8. Поколения вычислительных средств
- Контрольные вопросы, упражнения и задачи
- Глава 7 алгоритмизация и программирование
- 7.1. Определение алгоритма
- 7.2. Методы разработки алгоритма
- 7.2.1. Метод частных целей
- 7.2.2. Метод подъема
- 7.3. Программирование с отходом назад
- 7.4. Алгоритмы ветвей и границ
- 7.5. Жизненный цикл программного обеспечения
- Контрольные вопросы, упражнения и задачи
- Раздел III элементы информационных технологий глава 8 базы и банки данных
- 8.1. Автоматизированные банки данных
- 8.2. Модели данных
- 8.3. Схема функционирования субд
- 8.4. Организация поиска данных
- 8.5. Администратор базы данных
- Контрольные вопросы
- Глава 9 пакеты прикладных программ
- 9.1. Классификация ппп
- 9.2. Проблемно-ориентированные ппп
- 9.4. Интегрированные ппп
- 9.4. Пакеты прикладных программ для решения научно-технических задач
- 9.5. Библиотеки стандартных программ
- Контрольные вопросы
- Глава 10 вычислительные сети
- 10.1. Принципы построения и классификация вычислительных сетей
- 10.2. Способы коммутации и передачи данных
- 10.3. Программное обеспечение вычислительных сетей
- 10.4. Локальные вычислительные сети
- 10.4.1. Классификация лвс
- 10.4.2. Организация обмена информацией в лвс
- 10.4.3. Методы доступа в лвс
- 10.4.4. Модели взаимодействия в лвс
- 10.5. Обеспечение безопасности информации в вычислительных сетях
- Контрольные вопросы
- Глава 11 глобальная информационная сеть internet
- 11.1. Краткая характеристика основных информационных ресурсов internet
- 11.2. Принципы функционирования internet
- 11.2.1. Иерархия протоколов internet
- 11.2.3. Спецификация универсального адреса информационного ресурса в internet
- 11.3. Технология world wide web (www)
- 11.3.1. Общая характеристика www
- 11.3.2. Программы-клиенты www
- 11.3.3. Стратегия поиска информации в сети
- 11.3.4. Язык гипертекстовой разметки web-документов html
- 11.3.5. Поисковые машины www
- 11.4. Электронная почта в internet
- 11.5. Технологии доступа к ресурсам internet, отличные от www
- 11.5.1. Удаленный доступ к ресурсам сети telnet
- 11.5.2. Обмен файлами по протоколу ftp. Служба архивов ftp
- Контрольные вопросы
- Глава 12 искусственный интеллект
- 12.1. Направление исследований в области искусственного интеллекта
- 12.2. Машинный интеллект и робототехника
- 12.3. Интеллектуальные роботы
- 12.4. Моделирование биологических систем
- 12.5. Эвристическое программирование и моделирование
- 12.6. Система знаний
- 12.7. Модели представления знаний
- 12.7.1. Логическая модель представления знаний
- 12.7.2. Сетевая модель представления знаний
- 12.7.3. Фреймовая модель представления знаний
- 12.7.4. Продукционная модель представления знаний
- Контрольные вопросы
- Глава 13 экспертные системы
- 13.1. Общая характеристика эс
- 13.2. Структура и режимы использования эс
- 13.3. Классификация инструментальных средств эс
- 13.4. Организация знаний в эс
- 13.5. Отличие эс от традиционных программ
- 13.6. Виды эс
- 13.7. Типы задач, решаемых эс
- Контрольные вопросы
- Приложение 3 глоссарий экспертных систем