logo
Титоренко издание-1

3.8. Этапы создания базы и банка данных

Быстрое развитие информационных потребностей прикладных систем требует разнообразных подходов к созданию сложных и простых баз данных различной сложности. Сложность базы определяется объемами и структурой информатизации, разнообразием ее видов, множественностью связей между файлами, требованиями к производительности и надежности. Среди возможных вариантов создания рассмотрим наиболее распространенные подходы к со­зданию базы данных средней сложности.

Организация данных в базе требует предварительного моде­лирования, т. е. построения логической модели данных. Главное назначение логической модели данныхсистематизация разнооб­разной информации и отражение ее свойств по содержанию, структуре, объему, связям, динамике с учетом удовлетворения информационных потребностей всех категорий пользователей. Построение логической модели ведется по этапам с постепен­ным приближением к оптимальному варианту в рамках кон­кретных условий.

Полезность и эффективность логической модели зависят от степени отображения ею моделируемой предметной области. Предметная область включает объекты (например, клиентов, их счета, документы, операции и т.д.),их свойства и характеристики, взаимодействие и процессы над ними.

При построении базы данных на этапе создания ее логической модели сначала выявляются объекты, процессы или сущности предметной области, которые могут представлять интерес для пользователя. Например, объектами могут быть предприятия, вкладчики, банки и т.д. Для каждого объекта выделяется набор ха­рактеризующих его свойств (палей, реквизитов). Так, для вкладчи­ка —физического лица это могут быть: фамилия, имя, отчество, адрес, паспортные данные, место работы, вид вклада, сумма вклада и т.д. Для организации —ее наименование, адрес, расчетный счет, название банка и прочие.

Принятие решения о том, какая информация должна содер­жаться в БД, связано не только с определением предметной облас­ти или круга обслуживаемых задач, но и с интенсивностью работы с различными видами информации, их динамическими характери­стиками, частотой корректировки, степенью взаимосвязи и взаи­модействия между ними.

Практически большинство пользователей заинтересовано не в целой модели данных, а только в ее части. Например, бухгалтера не будут интересовать данные о вкладчиках банка —физических лицах. Поэтому в раде случаев должна быть обеспечена возможность выделения части данных (подмодели, локальной модели). Подмодель можно рассматривать как ограничение общей модели до уровня интересов (применений) конкретного пользователя или группы пользователей.

Автоматизацию работы базы данных обеспечивает СУБД, кото­рая манипулирует с конкретной моделью организации данных на носителе. При построении логической модели данных выбирается один из трех подходов моделирования: иерархический, сетевой, ре­ляционный.

Иерархическая модельимеет структуру в виде дерева и выражает вертикальные связи подчинения нижнего уровня высшему. Это облегчает доступ к необходимой информации, но только при усло­вии, что все запросы имеют древовидную структуру.

Сетевая модельявляется более сложной и отличается от иерар­хической модели наличием горизонтальных связей. Направления этих связей не являются однозначными, что усложняет модель и СУБД.

Реляционная модельпредставляется в виде совокупности таблиц, над которыми выполняются операции, формулируемые в терминах реляционной алгебры. Достоинством модели является сравнитель­ная простота инструментальных средств ее поддержки, недостат­ком —жесткость структуры данных и зависимость скорости работы от размера базы данных. К настоящему времени наибольшее рас­пространение получили реляционные модели. В них все компо­ненты связаны между собой определенными отношениями. Каж­дый тип модели имеет свои достоинства и недостатки. Одним из основных достоинств реляционной модели является простота по­нимания ее структуры.

Моделирование базы данных ведется поэтапно, при этом выде­ляется несколько уровней абстракции, каждому из которых соот­ветствует свой вариант модели. Необходимость выделения не­скольких уровней абстракции определяется сложностью процесса отображения предметной области в базе данных. Привязку логиче­ской модели к программным и техническим средствам называют физической моделью базы данных.Она и дает конечное материализо­ванное воплощение процессов создания базы данных.

После выбора окончательного варианта логической модели оп­ределяется вся совокупность показателей и реквизитов, необходи­мых и достаточных для решения обозначенного круга задач, формируются файлы, в которых выделяется ключевое поле (реквизит) для взаимодействия с другими файлами. Далее устанавливается тип данных и разрядность каждого поля, количество записей в файлах и другие характеристики.

Рассмотрим пример: в банке готовится задача компьютерного учета вклада «Срочный депозит». Для этой задачи создается под­модель базы данных. Эти данные должны включать сведения о вкладчике, данные по учету поступления и выбытию средств по вкладам, сведения для начисления процентов по вкладам. Все эти данные удобно поделить на реляционные таблицы или файлы. В одной таблице будут содержаться данные о вкладчиках: фамилия, имя, отчество, год рождения, серия и номер паспорта, дата выдачи и кем выдан паспорт, адрес постоянного места жительства, наиме­нование вида вклада, номер счета, дата открытия счета, остаток денежной суммы. Вторая таблица будет содержать сведения о дви­жении денежных средств по вкладам. Например, номер счета, фа­милия вкладчика, дата проведения операции по вкладу, взнос де­нежной суммы или снятие ее.

Первая и вторая таблицы связаны через общий реквизит —но­мер счета. Он позволяет в данных о движении денежных сумм не указывать подробные сведения о вкладчике, которые хранятся в первой таблице.

Затем для каждого реквизита определяется тип данного и его длина. При вводе или корректировке сведений в созданной базе СУБД должна автоматически контролировать тип вводимых дан­ных (не позволяя, например, вводить буквы в поле, определенное как числовое). Кроме того, данные контролируются на соответст­вие по длине и количеству знаков после точки. То есть если вво­дится символьное значение длиннее, чем описано в структуре, то это данное будет обрезано до указанной длины справа. При вводе даты проверяется ее соответствие формату даты. В числовом дан­ном автоматически добавляются знаки после точки.

В приведенном примере длину (разрядность) данных опреде­лить несложно. Берется максимальная значность для каждого чи­слового реквизита, для текстовых реквизитов можно предусматри­вать небольшие сокращения, не искажающие смысла данных.

Как правило, приходится при построении БД определять раз­мер текстового поля, когда его длина заранее не известна. Напри­мер, планируется машинный учет договоров с клиентами банка. Длина текста договора может быть различной в зависимости от предоставляемых услуг и специфики данного клиента. В этой си­туации заранее жестко определить длину договора невозможно, лишнее место на диске отводить также нерентабельно. В этом слу­чае и используется поле памяти. В частности, создается файл базы данных по учету договоров с клиентами, содержащий следующие реквизиты или поля: номер договора, дата заключения, наимено­вание клиента, предмет договора, текст договора. Для всех рекви­зитов, кроме текста договора, определить тип и длину записей не представляет трудности. Для поля с текстом договора указывается дополнительно поле памяти, длина которого 10символов. Предпо­ложим, что файл БД с данными договоров назвалиDOGOVOR.DBF. После указания типа поля на диске создается второй файл с тем же именем, но с расширениемDOGOVOR.DBT. В нем и будут содержаться тексты договоров любой необходимой длины, а в 10символах в поле памяти основного файла будет хра­ниться адрес расположения соответствующего текста в файлеDBT. Таким образом, первый основной файл БД для этой задачи содер­жит только каталог или оглавление к текстовому файлу, что облег­чает работу с ним. Аналогичный принцип реализуется при созда­нии различных справочно-поисковых систем.

Средства современных СУБД позволяют выполнять поиск в ба­зе данных как через файл-оглавление, так и прямо, обращаясь к тексту файла DBT. Запрос может содержать, например, название организации или какое-то ключевое слово из текста, по которому СУБД будет просматривать все тексты подряд до нахождения соот­ветствующего запросу текста.

Документирование результатов проектирования базы и банка данных выполняется по завершении каждого этапа проектирова­ния, а его выводы и рекомендации по эксплуатации обработки на­ходятся в соответствующих разделах технорабочего проекта. Рас­смотрим эти этапы применительно к созданию внутримашинного информационного обеспечения для компьютерных систем сред­него и крупного класса.

Проектированию ИО предшествует предпроектная стадия,ко­торая включает сбор материалов в процессе обследования, оформление их в виде технического задания. В них обосновывает­ся целесообразность создания банка и базы данных. В качестве ос­новных факторов раскрываются и приводятся следующие:

Материалы, содержащие выводы и предложения по созданию банка и базы данных исходя из конкретных условий и возможно­стей, включаются в технико-экономическое обоснование проекта и служат основанием для формирования технического задания на разработку системы банка данных, оно является частью общего технического задания на проектирование компьютерной системы. В нем ставятся цели и круг решаемых проблем, оговариваются масштабы и сферы деятельности системы, глобальные ограниче­ния.

На стадии технического проектированиярезультаты разработок и проектных решений оформляются в виде технического проекта. Он включает общие вопросы: такие, как определение конфигура­ции вычислительных средств, создание логической модели базы данных, ее уточнение и доводка в виде моделей других уровней, выбор операционной системы и СУБД, физическое проектирова­ние. Затем разрабатываются конкретные пользовательские приме­нения БД, определяются подмодели, доступные каждому из поль­зователей.

Технический проектявляется основным проектным документом, в котором приводятся разработки и их описания по всем компо­нентам создаваемого банка данных. При моделировании базы дан­ных используются различные методы и средства, ориентированные на выбор конкретной СУБД. Сюда же относятся и предбазовые процессы подготовки информации и работы с ней, определение технологических особенностей по всем процессам, возникающим в результате создания и внедрения банка данных. В техническом проекте отражаются организационные изменения, связанные с ра­ботой технических и программных средств, с новой организацией информации.

На этапе рабочего проектирования доводятся и детализируются решения технического проекта. Рабочий проектимеет ту же струк­туру, что и технический, но с более глубокой проработкой и про­веркой. На этом этапе выполняется сбор и предварительная подготовка нормативно-справочных материалов, разработка должност­ных, технологических инструкций для работы в условиях новой информационной технологии.

На этапе внедрения проектавыполняется проверка проектных решений и их доводка, при необходимости дорабатывается техно­логия работы с банком данных, пользователями, выполняется пе­рераспределение обязанностей, устанавливаются категории и ие­рархия доступа пользователей к данным.

Использование технологий базы и банка данных ставит вопро­сы дальнейшего развития компьютерных информационных систем: их реорганизацию, подключение новых пользователей, предостав­ление новых информационных услуг.

Более простые варианты построения базы данных ориентиро­ваны на решение менее сложных задач, на персональные компью­теры и персональные СУБД, на меньшие объемы данных и их не­сложную структуру. Современные СУБД предоставляют возмож­ность пользователям быстро и удобно создавать несложные базы данных.

Технология создания баз данных с помощью типовых инстру­ментальных средств, рассчитанных на массового пользователя-непрограммиста, предоставляется СУБД MicrosoftAccess. Несмотря на ориентированность на конечного пользователя, вAccessприсут­ствует язык программирования, имеется возможность интеграции с другими программными средствамиMicrosoftOffice.Access —это популярная настольная система управления базой данных, рассчи­танная на одного пользователя. В то же время на небольшом пред­приятии (при объеме данных до 1Гбайта) с количеством компью­теров не более 10ресурсовAccessвполне может хватить для обслу­живания всего делопроизводства вместе со средствамиMicrosoftOffice. Все пользователи могут обращаться к одной базе данных, установленной на одном компьютере, который может не быть сер­вером.

Проблемы сохранности и доступа к данным решаются с помо­щью использования средств защиты, которые предоставляет Access. Главными особенностямиAccessсреди других технологий создания баз данных является направленность на конечного пользователя (непрограммиста), сохранение общего подхода, принятого в по­строении всех продуктовMicrosoftдляWindows, массовость ис­пользования.

В Accessдля работы с данными используются процессор баз данных, средства быстрого построения интерфейса (Конструктор форм и отчетов), объекты доступа и манипулирования данными (таблицы, формы, запросы, отчеты, макрокоманды, макросы, мо­дули). Автоматизация типовых рутинных операций выполняется с помощью готовых визуальных средств или макрокоманд, объеди­няемых в макросы. Таким образом, пользователиAccessмогут об­ратиться к созданию процедур и функций для работы с данными. При этом, если недостает возможностей визуальных готовых средств, обращаются к макрокомандам, а если и их возможно­стей недостаточно, можно использовать язык программирова­ния. Он позволяет создавать свои массивы, типы данных, функции, приложения. Имеется возможность целиком создать базу данных с помощью программирования, когда в этом появ­ляется необходимость.

Создание новой базы данныхначинается с запускаAccessи появления диалогового окна. Выбор опцииЗапуск мастера приводит в окноСоздание.Далее для создания базы можно использовать шаблоны. Чтобы обратиться к списку шабло­нов, необходимо перейти на вкладкуБазы данных.Создаются базы данных выбором из определенного списка. При этом возможен выбор таблиц, а в таблицах —нужных полей. По­сле этого пользователь получает базу данных с таблицами, формами ввода и вывода. В табл. 3.4приведен списокмасте­ров(программных модулей), имеющихся вAccess. Дополни­тельно к перечисленным возможностям все созданные фор­мы можно редактировать с помощью вспомогательных диа­логовых окон. При первом знакомстве сAccessтакой способ создания баз данных весьма эффективен.

Технология ввода данныхв базу допускает использование табли­цы и формы, через которые обеспечивается работа только с одной строкой таблицы. Ввод с помощью формы позволяет располагать поля в нужном порядке, удобном для пользователя. Создание форм может выполнять пользователь сам или с помощьюМастера.Эта­пы создания формы включают выбор полей, внешнего вида, стиля и названия формы.

Работа с базой данных начинается с создания таблиц. Обраще­ние к режиму Создатьпредоставляет возможность выбора одного из пяти вариантов технологии создания таблицы (табл. 3.5).

Таблица 3.4.