logo search
МИР учебник

5.2. Характеристика баз данных

Наиболее многочисленным и важным классом информаци­онных ресурсов в составе информационных технологий явля­ются базы данных (БД). В современном мире практически ни одна автоматизированная система управления не обходится без БД. Базы данных являются основой большинства современных справочных систем, систем автоматизированного ведения бух­галтерского учета, экспертных систем и многих других. Это обус­ловлено прежде всего простотой и удобством этого типа хране­ния и извлечения данных.

База данных — упорядоченная организованная совокуп­ность взаимосвязанных данных, предназначенных для хране­ния, накопления и обработки с помощью ЭВМ. Иначе говоря, это набор данных, который достаточен для достижения установлен­ной цели и представлен на машиночитаемых носителях (маг­нитная лента, запоминающее устройство, дискета, компакт-диск и т.п.) в виде, позволяющем осуществлять автоматизированную переработку содержащейся в нем информации.

Создание и эксплуатация БД во многом определяют эффективность различных сфер деятельности, начиная от раз­работки и реализации важнейших решений развития отрасли в целом и кончая удовлетворением индивидуальных запросов руководителей, ученых и специалистов.

Для создания и ведения базы данных (обновления, обеспе­чения доступа к ним по запросам и выдачи их пользователю) используется набор языковых и программных средств, называ­емых системой управления базы данных (СУБД).

В зависимости от функционального назначения БД подраз­деляются на следующие классы:

В России в настоящее время БД распределены следующим образом: наибольшую долю занимают справочные БД — при­мерно 51%, БД по научно-технической информации —19%, учеб­ные БД — 15% и исследовательские БД — 15%.

По форме представления информации рассматриваются текстовые, числовые, изобразительные, а также звуковые (аудио) БД. В общем числе БД, представленных на мировом рын­ке, 70% являются текстовыми. Однако рост числа таких БД и их доля в последние годы снижаются.

По характеру записи текста БД подразделяются на тексто­вые и гипертекстовые.

По содержанию БД разделены на следующие типы:

Документальная БД содержит записи, которые отражают документы и содержат их библиографические описания и, воз­можно, иную информацию о них. Причем библиографическая БД содержит только библиографическое описание, реферативная БД — библиографические данные и реферат, полнотекстовая БД — полный текст документа или его наиболее информативные части, а документально-фактографическая БД — формальное представление содержания документа.

ФактографическаяI БД — база данных, записи в которой содержат данные о состоянии внешнего мира с учетом ссылок на отражающие их документы. Ее разновидности: объектогра фическая БД (содержит данные об отдельном объекте), база по­казателей (содержит данные о той или иной характеристике объекта).

ЛексикографическаяII БД объединяет записи, каждая из которых содержит данные об одной лексической единице и со­ответствует статье словаря.

Гипертекстовая БД включает записи, которые содержат информацию в виде текста на естественном языке и указание на связи их с другими записями, позволяющими компоновать логически связанные фрагменты БД.

Среди упомянутых типов БД в зарубежных информацион­ных системах особенно четко прослеживается тенденция уве­личения удельного веса фактографических баз данных, где они составляют около одной трети, а в наиболее крупных информа­ционных фирмах — до 60—70% от общего объема баз данных. В документальных БД все большую долю занимают полнотек­стовые базы данных — электронные версии различных изда­ний. За последние десятилетия они развиваются очень быстры­ми темпами и стали важнейшим источником информации во всех областях науки и техники.

По способу доступа БД классифицируют следующим об­разом:

Широкое распространение получили БД на CD-ROM (оп­тических дисках). Объяснение этому — множество достоинств, среди которых: компактность, большой объем памяти для хра­нения информации, возможность ведения многоаспектного по­иска, независимость от внешних факторов (например, сбоев в системе связи), возможность формировать свой фонд машино­читаемых носителей, возможность быстрого поиска необхо­димого материала по многим признакам. Причем результаты поиска могут быть выведены на печать, скопированы на дис­кету или жесткий диск.

С технической стороны использование CD-ROM благодаря удобному интерфейсу и отсутствию необходимости подключе­ния к внешним сетям передачи данных представляется более простым делом, чем с удаленными БД.

Несмотря на известные достоинства компакт-дисков, сей­час наблюдается постепенный переход от CD-ROM к онлайно­вому способу предоставления информации.

Появление и быстрое развитие интерактивных информа­ционных систем (ИИС), которые предоставляют пользователям независимо от их географического положения удаленный дос­туп к большому числу ИР через терминалы, обусловили появ­ление и значительный рост БД. Использование ИИС в диалого­вом режиме обеспечивает следующие возможности:

Диалоговый доступ к БД в мире в настоящее время являет­ся доминирующим. Услуги диалогового доступа к базам данных представляют собой основной, наиболее динамичный и ведущий вид современных информационных услуг.

В качестве примера ниже приведены некоторые базы дан­ных общего использования.

Библиографическая БД "Российский сводный каталог по научно-технической литературе". Генератор — Государ­ственная публичная научно-техническая библиотека (ГПНТБ). Эта база данных содержит сведения о зарубежных и российс­ких книгах, а также о зарубежных периодических изданиях, по­ступивших в организации — участницы Автоматизированной системы Российского сводного каталога (АС РСвК).

Объем БД составляет более 530 тыс. записей. Ежегодное пополнение — около 30 тыс. записей по всем видам изданий. Каждая запись в БД содержит кроме библиографического опи­сания на языке оригинала индексы Государственного рубрика­тора научно-технической информации (ГРНТИ), коды органи­заций-фондодержателей. Кроме того, часть записей БД содер­жит: по зарубежным книгам — перевод заглавий на русском языке, а также предметные рубрики и ключевые слова, по за­рубежным периодическим изданиям — аннотацию на русском языке, по российским книгам — аннотацию на русском и (или) английском языках и предметные рубрики.

БД "Продукция предприятий оборонного комплекса". Генератор — Всероссийский научно-исследовательский инсти­тут межотраслевой информации (ВИМИ). Содержит сведения о 30 тыс. наименований продукции народнохозяйственного на­значения, включая оборудование для переработки сельскохо­зяйственной продукции, производимой предприятиями оборон­ной промышленности.

БД "Научно-технические разработки и производствен­ный опыт". Генератор — Российское энергеническое агенство Минэнерго России ("Росинформресурс").

Как показывает анализ мирового опыта, БД являются наи­более перспективной и технологически обеспеченной частью ИР, которые аккумулируют самые различные знания. Они становят­ся измерителями информационного потенциала страны, а воз­можность свободного и оперативного доступа к ним — мерой информационности общества.