logo
Отчет по практике 2 курс специальности 230105

Приложение 2. Тема: Базы Данных

База данных — важнейшая составная часть информационных

систем. Информационные системы предназначены для хранения и

обработки больших объемов информации. Изначально такие системы

существовали в письменном виде. Для этого использовались различные

картотеки, папки, журналы, библиотечные каталоги и т.п. Базы данных

— это реализованная с помощью компьютера информационная структура

(модель), отражающая состояния объектов и их отношения [1].

В общем смысле термин «база данных» можно применить к любой

совокупности связанной информации, объединенной вместе по

определенному признаку. Примерами баз данных могут служить

адресная книга, картотека, словарь, энциклопедия или кафедральный

журнал. При этом в качестве базы данных рассматривается только

набор данных, организованных определенным образом.

База данных предполагает наличие комплекса программных

средств, обслуживающих эту базу данных и позволяющих использовать

содержащуюся в ней информацию. Такие комплексы программ

называются СУБД (системы управления базой данных). Это комплекс

программных средств, предназначенных для создания структуры новой

базы, наполнение ее содержимым, редактирование содержимого и

визуализации информации. Под визуализацией информации базы

понимается отбор отображаемых данных в соответствии с заданным

критерием, их упорядочение, оформление и последующая выдача на

устройства вывода или передачи по каналам связи.

В мире существует множество систем управления базами данных.

Несмотря на то, что они могут по–разному работать с разными

объектами и предоставляют пользователю различные функции и

средства, большинство СУБД опираются на единый устоявшийся

комплекс основных понятий.

Основные функции СУБД:

1. Определение данных — определить, какая именно

информация будет храниться в базе данных, задать свойства данных, их

тип, а также указать, как эти данные связаны между собой.

2. Обработка данных — данные могут обрабатываться самыми

разными способами. Можно выбирать любые поля, фильтровать и

сортировать данные. Можно объединять данные со связанной

информацией, вычислять итоговые значения.

3. Управление данными — можно указать, кому разрешено

знакомиться с данными, корректировать их или добавлять новую

информацию. Можно определить правило коллективного доступа.

СУБД поддерживают один из возможных типов моделей данных —

сетевую, иерархическую или реляционную, которые являются

важнейшими признаками классификации СУБД.

Основными средствами СУБД являются:

● средства задания структуры данных;

● средства конструирования экранных форм, предназначенных для

ввода данных, просмотра и обработки в диалоговом режиме;

● средства создания запросов для выборки данных при заданных

условиях, а также выполнения операций по их обработке;

● средства создания отчетов из базы данных для вывода на печать

результатов обработки в удобном для пользователя виде;

● языковые средства — макросы, встроенный алгоритмический

язык, язык запросов и т.п., которые используются для реализации

нестандартных алгоритмов обработки данных, а также процедур

обработки событий в задачах пользователя;

● средства создания приложений пользователя, позволяющие

объединять различные операции работы с базой данных в единый

технологический процесс.

Архитектура СУБД состоит из двух основных компонентов: языка

описания данных и языка манипулирования данными. Язык описания

данных (ЯОД) — средства описания данных в БД и связей между ними.

Средствами этого языка описывается структура БД, форматы записей,

пароли, защищающие данные.

Язык манипулирования данными (ЯМД) — язык для выполнения

Обычно с базами данных работают две категории пользователей.

Первая категория — проектировщики. Их задача состоит в разработке

структуры таблиц базы данных и согласовании ее с заказчиком. Вторая

категория исполнителей, работающих с базами данных,

пользователи. Они получают исходную базу данных от

проектировщиков и занимаются ее наполнением и обслуживанием.

Соответственно СУБД имеет два режима работы:

проектировочный и пользовательский. Первый режим предназначен

для создания или изменения структуры базы и ее объектов. Во втором

режиме происходит использование ранее подготовленных объектов для

наполнения базы или получения данных из нее.

Наиболее известные СУБД: Paradox, Microsoft FoxPro и Visual FoxPro, Microsoft Access, OpenOffice.org Base, Microsoft Access…

Основные понятия баз данных

Классификация баз данных

Рассмотрим классификацию баз данных. По технологии обработки

данных базы данных подразделяются на централизованные и

распределенные. Централизованная база данных хранится в

памяти одной вычислительной системы. Эта вычислительная система

может быть мэйнфреймом — тогда доступ к ней организуется с

использованием терминалов — или файловым сервером локальной сети

ПК. Распределенная база данных состоит из нескольких, возможно,

пересекающихся или даже дублирующих друг друга частей, которые

хранятся в различных ЭВМ вычислительной сети. Работа с такой базой

осуществляется с помощью системы управления распределенной базой

данных (СУРБД).

База данных может быть в монопольном распоряжении

пользователя одного персонального компьютера. В этом случае она

размещается только на дисках данного компьютера и к

информационной базе не обеспечивается одновременный доступ

нескольких пользователей. При наличии сети персональных

компьютеров открывается возможность хранить и использовать

централизованные базы данных, размещаемые на машине–сервере, в

многопользовательском режиме. Это позволяет классифицировать базы

данных по способу доступа к данным. Согласно этой классификации,

базы данных делятся на базы данных с локальным доступом и

базы данных с сетевым доступом. Для всех современных баз данных

можно организовать сетевой доступ с многопользовательским режимом

работы.

Существуют разные подходы к организации баз данных.

Иерархические базы данных — в основе данной модели лежит

иерархическая модель данных. В этой модели имеется один главный

объект и остальные — подчиненные — объекты, находящиеся на разных

уровнях иерархии. Взаимосвязи объектов образуют иерархическое

дерево с одним корневым объектом. Иерархическая БД состоит из

упорядоченного набора нескольких экземпляров одного типа дерева.

Автоматически поддерживается целостность ссылок между предками и

потомками. Основное правило: никакой потомок не может

существовать без своего родителя.

Другой подход к организации баз данных — сетевые базы

данных. Сетевой подход к организации данных является расширением

иерархического. В иерархических структурах запись–потомок должна

11.

иметь в точности одного предка; в сетевой структуре данных потомок

может иметь любое число предков.

К современным базам данных относят реляционные системы.

Реляционные системы далеко не сразу получили широкое

распространение.

К современным базам данных относят реляционные системы.

Реляционные системы далеко не сразу получили широкое

распространение. В то время как основные теоретические результаты в

этой области были получены еще в 70–х годах и тогда же появились

первые прототипы реляционных СУБД, долгое время считалось

невозможным добиться эффективной реализации таких систем. Однако

постепенное накопление методов и алгоритмов организации

реляционных баз данных и управления ими привели к тому, что уже в

середине 80–х годов реляционные системы практически вытеснили с

мирового рынка ранние СУБД. Реляционная модель данных

основывается на математических принципах, вытекающих

непосредственно из теории множеств и логики предикатов. Эти

принципы впервые были применены в области моделирования данных в

конце 60–х годов доктором Е.Ф. Коддом, в то время работавшим в IBM, а

впервые опубликованы в 1970 г.

Реляционные базы данных характеризуются тем, что информация

в них хранится в одной или нескольких таблицах. Между таблицами

могут существовать связи по ключевым значениям. При дальнейшем

изложении под базой данных мы будем понимать реляционную

компьютерную базу данных.

Каждая таблица состоит из строк и столбцов, которые в

компьютерной базе данных называются записями и полями

соответственно. Каждая запись содержит информацию об отдельном

объекте системы: одном ученике в школе, одной книге в библиотеке и

т.п. А каждое поле — это определенная характеристика (свойство,

атрибут) объектов: фамилия ученика, год рождения, название книги,

автор книги и т.п. Поля таблицы должны иметь несовпадающие имена.

Каждое поле таблицы имеет определенный тип. Тип — это множество

значений, которые поле может принимать, и множество операций,

которые можно выполнять над этими значениями. Существуют четыре

основных типа для полей баз данных: символьный, числовой,

логический и дата. Например, для полей таблицы «Библиотека» могут

быть установлены следующие типы (табл. 1):

Инв_номер, год_изд Числовой

Дата_поступления Дата

12

Чтобы автоматизировать процесс нужных записей в таблицах баз

данных, необходимо указать поле или несколько полей, значения

которых позволяют однозначно выбрать из всей совокупности записей в

таблице именно ту запись, которая интересует запрашивающего

информацию. Такое поле или группа полей называется первичным

ключом или просто ключом таблицы. Значение первичного ключа

должно быть уникальным. Для каждой таблицы реляционной базы

данных должен быть определен первичный ключ. Например, в

библиотечной базе данных таким ключом может быть выбран

инвентарный номер книги, который не может совпадать у разных книг.

Важным требованием, предъявляемым к таблицам реляционной

модели, является нормализация данных, представленных таблицей.

Первично нормализованная таблица содержит строки, в которых для

каждого атрибута может быть только одно значение. Это соответствует

требованиям недопустимости множественных и повторяющихся

структур данных. Ненормализованной таблице обычно соответствует

одна или несколько нормализованных таблиц.

Понятие нормальной формы было введено Эдгаром Коддом при

создании реляционной модели баз данных. Основное назначение

нормальных форм — приведение структуры базы данных к виду,

обеспечивающему минимальную избыточность. Устранение

избыточности производится за счет декомпозиции отношений (таблиц)

таким образом, чтобы свести к минимуму функциональные зависимости

между их атрибутами (полями).

Нормализация может применяться к таблице, первоначально

отвечающей следующим требованиям:

● Таблица содержит нуль или более записей.

● Все записи таблицы имеют одно и то же множество полей, причем

одноименные поля относятся к одинаковым типам данных.

● Таблица не может содержать двух полностью идентичных записей.

Приведем два примера первых двух нормальных форм. Первая

нормальная форма (1NF). Таблица находится в первой нормальной

форме, если каждый ее атрибут атомарен и все строки различны. Под

выражением «атрибут атомарен» понимается, что атрибут может

содержать только одно значение. Таким образом, не соответствуют 1NF

таблицы, в полях которых могут храниться списки значений. Для

приведения таблицы к 1NF обычно требуется разбить таблицу на

13

Если в базе нет никаких данных (пустая база), то это все равно

полноценная база данных. Этот факт имеет методическое значение.

Хотя данных в базе и нет, но информация в ней все–таки есть — это

структура базы. Она определяет методы занесения данных и хранения

их в базе. Простейший «не компьютерный» вариант базы данных —

деловой ежедневник, в котором каждому календарному дню выделено

по странице. Даже если в нем не записано ни строки, он не перестает

быть ежедневником, поскольку имеет структуру, четко отличающую его

от записных книжек, рабочих тетрадей и прочей писчебумажной

продукции.

Базы данных могут содержать различные объекты. Основными

объектами любой базы данных являются ее таблицы. Простейшая база

данных имеет хотя бы одну таблицу. Соответственно структура

простейшей базы данных тождественно равна структуре ее таблицы.

Структуру двумерной таблицы образуют столбцы и строки. Их

аналогами в простейшей базе данных являются поля и записи. Если

записей в таблице пока нет, значит, ее структура образована только

набором полей. Изменив состав полей базовой таблицы (или их

свойства), мы изменяем структуру базы данных и соответственно

получаем новую базу данных.

Рассмотрим объекты базы данных (на примере СУБД

OpenOffice.org Base).

Таблицы

Таблицы — это основные объекты любой базы данных. Во–первых,

в таблицах хранятся все данные, имеющиеся в базе, а во–вторых,

таблицы хранят и структуру базы (поля, их типы и свойства). Таблица

предназначена для хранения данных в виде записей (строк) и полей

(столбцов). Обычно каждая таблица используется для хранения

сведений по одному конкретному вопросу.

База данных (БД, database) —это реализованная с помощью

компьютера информационная структура (модель), отражающая

состояния объектов и их отношения.