logo

81. Модели "сущность-связь" (erd)

Моделирование предметной области базируется на использовании графических диаграмм, включающих небольшое число разнородных компонентов. В связи с наглядностью представления концептуальных схем БД, ER-модели получили широкое распространение в системе CASE, поддерживающей автоматизированное проектирования реляционных БД.

Сущность - реальный/представляемый объект, информация о котором должна сохраняться и быть доступной. На диаграмме сущность - прямоугольник, содержащий имя сущности, при этом имя сущности – имя типа. а не некоторого конкретного экземпляра этого типа.

Аэропорт

Шереметьево Хитроу

- изображение сущности «Аэропорт» с примерными объектами.

Каждый экземпляр сущности должен быть отличен от любого другого

экземпляра той же сущности.

С

билет

для

вязь – графическая ассоциация, всегда устанавливается между 2 сущностями. Эта ассоциация всегда является бинарной и может существовать между 2 разными сущностями или между сущностью и ей же самой(рекурсивная связь). В любой связи выделяют 2 конца, на каждом из которых указывают имя конца связи, степень конца связи, обязательность связи(любой экземпляр участвует). Связь представляют в виде линии, связывающей 2 сущности, или ведущей от сущности к ней же самой, при этом в месте стыковки связи с сущностью используют трехточечный вход в прямоугольник сущности, если для этой сущности связи могу использовать многие экземпляры сущности, и одноточечный вход, если в связи участвует 1 экземпляр сущности. Обязательный конец связи изображают сплошной линией, необязательный – прерывистой.

пассажир

имеет

Конец связи с именем «для» позволяет связать с 1 пассажиром более 1 билета, причем каждый билет связан с каким-либо пассажиром. Конец «имеет» означает, что каждый билет принадлежит 1 пассажиру, причем пассажир не обязан иметь хотя бы 1 билет.

Человек

сын

отец

Рекурсивная связь – каждый человек – сын только 1 человека. Каждый человек может являться отцом 1 и более людей.

Атрибут сущности – любая деталь, служащая для уточнения идентификации, классификации, числовой характеристики или выражения состояния сущности. Имена атрибутов заносятся в прямоугольник сущности, под именем сущности и изображаются малыми буквами.

Уникальный идентификатор - атрибут, комбинация атрибутов, комбинация связей или комбинация связей и атрибутов, уникально отличающий любой экземпляр сущности от другого экземпляра сущности того же типа.

82. Нормализация модели данных

При проектировании реляционной базы данных вам необходимо решить вопрос о наиболее эффективной структуре данных. Приведение модели к требуемому уровню нормальной формы является основой построения реляционной базы данных. В процессе нормализации элементы данных группируются в таблицы, представляющие объекты и их взаимосвязи. Теория нормализации основана на том, что определенный набор таблиц обладает лучшими свойствами при включении, модификации и удалении данных, чем одна таблица Основные цели, которые при этом преследуются:

- Обеспечить быстрый доступ к данным в таблицах.

- Исключить ненужное повторение данных, которое может являться причиной ошибок при вводе и нерационального использования дискового пространства вашего компьютера.

- Обеспечить целостность данных таким образом, чтобы при изменении одних объектов автоматически происходило соответствующее изменение связанных с ними объектов.

Процесс уменьшения избыточности информации в базе данных называется нормализацией. В теории нормализации баз данных разработаны достаточно формализованные подходы по разбиению данных, обладающих сложной структурой, среди нескольких таблиц. Эти вопросы детально освещаются в специальной литературе. Мы остановимся на некоторых практических аспектах нормализации таблиц, не рассматривая их теоретическое обоснование. Нормализация информационной модели выполняется в несколько этапов. Теория нормализации баз данных оперирует с пятью нормальными формами таблиц (от первой до пятой включительно). Эти формы предназначены для уменьшения избыточной информации от первой до пятой нормальной формы. Поэтому каждая последующая нормальная форма должна удовлетворять требованиям предыдущей формы и некоторым дополнительным условиям. При практическом проектировании баз данных четвертая и пятая формы, как правило, не используются, поэтому мы ограничимся рассмотрением первых трех нормальных форм. Отношения обладают следующими свойствами

Отношение называется нормализованным, если каждая компонента кортежа является простым, атомарным значением, не состоящим из группы значений. Это не позволяет заменять значение атрибута другим: отношением (что привело бы к сетевому или иерархическому отношению).

 

Нормализованное отношение представляется в виде личной структуры. Имя таблицы (соответствует имени отношения, имена столбцов - именам атрибутов, а строки таблицы - кортежам.

Упорядочение кортежей теоретически несущественно, однако оно может влиять на эффективность, доступа к кортежам.

Все строки (кортежи) отношения должны быть различными.

В отношении могут существовать несколько одиночных или составных атрибутов, которые однозначно идентифицируют кортеж отношения. Такие атрибуты называютсявозможными ключами. Один из них выбирается в качестве первичного ключа для обеспечения доступа к кортежам.

Реляционная база данных, является совокупностью изменяющихся во времени нормализованных (отношений различных степеней, которые могут быть связаны Друг с другом через общие домены.

Замечание. Различие между математическим отношением и отношением базы данных состоит в том, что состояние последнего может меняться со временем при добавлении и/или удалении отдельных кортежей. Число атрибутов, входящих в отношение, называется степенью отношения, а число кортежей отношения -кардинальным числом или мощностью отношения. Навигация по отношениям базы данных осуществляется путем их соединения с помощью атрибутов, определенных над общими или сравнимыми доменами. Операция соединения включает сравнение значений «атрибутов соединения» кортежей одного отношения (исходного) с кортежами другого отношения (щелевого) и выборку пар кортежей, удовлетворяющих сравнению.

Первая нормализованная форма таблицы.

f Данные, представленные в виде двумерной таблицы, являются первой нормальной формой реляционной модели данных.

Таблица, структура которой приведена в таблице 5.4.1, является ненормализованной; Таблица в первой нормальной форме должна удовлетворять следующим требованиям:

1. Таблица не должна иметь повторяющихся записей.

2. В таблице должны отсутствовать повторяющиеся группы полей.

3. Строки должны быть не упорядочены.

4. Столбцы должны быть не упорядочены.

Вторая нормальная форма.

Отношение задано во второй нормальной форме, если оно является отношением в первой нормальной форме и каждый атрибут, не являющийся первичным в этом отношении, полностью зависит от любого возможного ключа этого отношения.

Третья нормальная форма.

Отношение задано в третьей нормальной форме, если оно задано во второй нормальной форме и каждый атрибут этого отношения, не являющийся первичным, не транзитивно зависит от каждого возможного ключа этого отношения.

Сведение таблицы к третьей нормальной форме предполагает разделение таблицы с целью помещения в отдельную таблицу (или несколько таблиц) столбцов, которые не зависят от полного ключа. В результате такого разбиения каждое из неключевых полей должно оказаться независимым от какого-либо другого неключевого поля.

После определения структуры таблиц, отношений между ними и совпадающих полей, которые будут использованы для связывания от дельных таблиц, мы готовы приступить к созданию многотабличной базы данных