logo
Informatics

8.1. Автоматизированные банки данных

В настоящее время в нашей стране накоплен большой опыт раз работки автоматизированных систем управления. Этот опыт говорит о том, что центральным техническим вопросом разработки АСУ и любых других информационных систем является организация, хранение и комплексное использование данных. В конечном счете это привело к созданию развитых средств управления данными, которые являются основой любой информационной системы, построенной на базе использования средств вычислительной техники.

Автоматизированные системы управления, спроектированные на основе концепции банков данных, обладают целым рядом характерных свойств, которые выгодно отличают их от предшествующих разработок, основой которых была система массивов данных, ориентированная на решении комплекса установившихся задач. Использование автоматизированных банков данных позволяет обеспечить многоаспектный доступ к совокупности взаимосвязанных данных, достаточно высокую степень независимости прикладных программ от изменений логической и физической организации данных, интеграции и централизации управления данными, устранение излишней избыточности данных, возможность совмещения пакетов и телепроцессорной обработки данных.

Поэтому разработки АСУ управления для любой сферы применения связаны прежде всего с созданием автоматизированных банков данных.

Так как основой любого управления является информация о состоянии объекта, то именно поэтому данные в автоматизированных системах, их организация, тщательное ведение, хранение, использование являются центром системы. Меняются техника, программное хозяйство, но данные остаются, работа с ними оказывается делом достаточно дорогим и именно поэтому задумались над системными принципами их организации, положенными в основу создания банков данных.

Под автоматизированным банком данных понимается организационно-техническая система, представляющая собой совокупность баз данных пользователей, технических и программных средств формирования и ведения этих баз и коллектива специалистов, обеспечивающих функционирование системы.

В самом общем виде основные функции банка данных можно сформулировать следующим образом: адекватное информационное отображение предметной области, обеспечение хранения, обновления и выдачи необходимых данных пользователям.

Составными частями любого банка данных являются база данных, система управления базой данных (СУБД), администратор базы данных, прикладное программное обеспечение.

Функционирование системы управления базой данных основано на введении двух уровней организации базы данных - логического и физического. Эти два уровня соответствуют двум аспектам организации данных: физическому с точки зрения хранения данных в памяти ЭВМ и логическому с точки зрения использования данных в прикладных приложениях.

Описание логических организаций баз данных определяет взгляд пользователей на организацию данных в системе, которые отображают состояние некоторой предметной области. Необходимо отметить, что в общем случае структуры физической и логической организации данных могут не совпадать. Формальное описание логической организации данных иногда называют моделью данных или схемой.

Говоря о физической организации, необходимо отметить, что существует много различных способов организации данных в запоминающей среде, с помощью которых можно обеспечить соответствие некоторой модели.

Наиболее общее представление о базе данных заключается в следующем: база данных (date base) - это совокупность хранимых во внешней памяти ЭВМ большого объема данных; база данных являет<интегрированной>, т.е. представляет собой комплекс взаимосвязанных данных, предназначенный для обеспечения информационных нужд различных пользователей, каждый из которых имеет отношение к отдельным, возможно, совместно используемым частям данных, работа с базой данных может осуществляться либо в пакетном режиме, либо с удаленных терминалов в режиме реального времени.

Таким образом, база данных - это совокупность хранимых в памяти ЭВМ и специальным образом организованных взаимосвязанных данных, отображающих состояние предметной области. База данных также предназначена для обеспечения информационных нужд определенных пользователей.

Создание единой базы данных о предметной области сложно и в настоящее время практически нереализуемо, хотя бы из-за недостаточного объема памяти современных ЭВМ. На практике большинство баз данных проектируется для ограниченного числа приложений. На одной ЭВМ, как правило, создается несколько различных баз данных.

Со временем некоторые базы данных, предназначенные для выполнения родственных функций, могут объединиться, если это будет способствовать повышению производительности всего вычислительного комплекса.

Создание баз данных обеспечивает интеграцию данных и возможность централизованного управления данными.

Объекты и отношения объектов. Любая информационная система должна отображать те или иные стороны окружающего нас реаьного мира или, как иногда говорят, проблемной или предметной области. Мы воспринимаем окружающий мир состоящим из объектов, которые человек, по совокупности определенных достаточно устойчивых свойств, группирует в наборы (классы) объектов, которым присваивает имя. Например, в реальном мире есть конкретные соки, но нет собаки <вообще>. Понятие <собаки> описывает целый класс в каком-то смысле однородных реальных объектов.

Проблемная среда изменяется со временем, что выражается в изменении свойств объектов, возникновении новых и исчезновении объектов. Эти изменения происходят в результате событий.

Временная последовательность событий образует процесс. Всякая информационная система имеет дело не с самими объектами, как реальными сущностями, а с их знаковыми отображениями-идентификаторами. Главная функция знака-идентификатора - отличить объект в группе однородных объектов. Идентификатор объекта может не нести никакой информации о свойствах объекта или, что то же самое, об его принадлежности к тому или иному классу.

Например, 11591 - <табельный номер служащего> - является деловым идентификатором. Этот идентификатор не описывает свойства, их приходится задавать дополнительно.

Более полно объект описывается записью об объекте, которая обычно состоит из идентификатора объекта-знака, позволяющего отличить один объект от другого среди однородных объектов, и идентификаторов (значений) свойств (атрибутов). Например, запись о служащем некоторой организации имеет табельный номер служащего в качестве идентификатора и такие элементы данных, как должность, заработная плата, льготы и т.д., рассматриваемые как идентификаторы (значения) свойств служащего.

Следует подчеркнуть, что понятие объекта и свойства относительны. Если речь идет о служащем, то естественно понимать должность как свойство служащего. Но если речь идет о должности, например, в смысле должностных инструкций, то уже сама должность выступает в качестве объекта, который может иметь свойства. В частности, в определенном контексте табельный номер служащего может рассматриваться как свойство должности.

Поэтому при информационном отображении предметных сред можно (а иногда и нужно) говорить не об объектах и их свойствах, а об отношениях объектов, ибо в этом случае все идентификаторы в записи можно рассматривать симметрично, а не в ориентации на один специально выделенный объект. Как увидим позднее. это соответствует так называемой реляционной точке зрения на баз данных.

При информационном отображении реального мира весьма важно, в каких количественных пропорциях могут осуществляться отношения объектов. Четкое понимание того, к какой категории относится отношение объектов, позволяет сделать заключение о возможном характере связи между соответствующими данными. Фиксация этой стороны при информационном отображении предметной области определяет одну из сторон модели данных. Важно подчеркнуть, что характер отношений одних и тех же объектов не есть нечто застывшее.

Оно может измениться и тогда изменится характер связей между элементами данных, который может оказать существенное влияние на структуру банка данных, как логическую, так и физическую. Усложнение характера связей между данными делает более сложными программы их обработки.

Данные. Информация об объекте или отношениях объектов, выраженная в знаковой форме, образует данные. Эти данные могут быть восприняты человеком или каким-либо техническим устройством и соответствующим образом интерпретированы.

Характерной особенностью данных является то, что их можно переводить из одной знаковой системы в другую (перекодировка) без потери информации. Это существенное свойство знакового отображения позволяет описывать реальную предметную ситуацию в различных системах знаков, ориентированных на воспринимающего.

При построении банков данных стало уже традиционным говорить о логическом отображении, ориентированном на человека, и о физическом отображении, ориентированном на устройства долговременной памяти.

Следует отметить, что знаки сами по себе не образуют данных, несущих информацию о предметной области. В простейшем случае знаки должны быть структурно оформлены в виде фиксированной последовательности - записи, а каждое поле записи (в которое помещается знак) должно иметь интерпретацию с точки зрения предметной области, для которой создается банк данных. Например, если знаки образуются из букв русского алфавита по правилам образования слов русского языка, будучи взяты сами по себе, они несут только информацию о правилах образования знаков - синтаксическая информация. И в этом смысле их можно рассматривать как данные.

С точки зрения отображения предметной области для нас представляет интерес семантическая информация, а именно, как определенные знаки связаны с объектами предметной области и их отношениями.. Самый простейший способ реализовать эту связь - это принять определенное содержание (смысл) полю записи. Например, если интерпретируется как <должность служащего>, то любые знаки, помещенные в это поле, будут пониматься как конкретные идентификаторы различных должностей, и в этом смысле мы их рассматриваем как данные о предметной области.

Целесообразно кратко рассмотреть прагматический аспект знакового отображения. Если определены структуры записей обо всех объектах предметной области и их отношениях, то будем говорить, что дана модель данных предметной области.

Если предметная область обширна, например производственная деятельность предприятия, то и ее модель данных будет достаточно велика. На предприятии практически нет человека, который представляет производственную деятельность во всей ее детализации, а это значит, что модель данных в целом никому из управляющего состава предприятия не нужна. Сама эта проблема (построение общей модели) возникла только в связи с разработкой и эксплуатацией автоматизированных информационных систем. Для каждого конкретного отдела или звена управления производственной деятельности характерна своя сфера информационных интересов, которая тоже может быть описана своей моделью данных.

По отношению к общей модели данных рассмотримте как подмодель. В общем случае подмодель данных - это непростое механическое усечение модели. Подмодель данных конкретного пользователя может быть связана со всей моделью данных весьма сложными структурными преобразованиями.

Понятие подмодели характеризует прагматический аспект знакового отображения.