logo
Lektsii_MIR_zaochniki

2. Службы-генераторы баз данных.

Первоначально переход на электронную форму издания БД был совершен службами, выпускавшими реферативные журналы, экспресс-информацию, обзоры и прочие виды вторичных документов, поэтому ранее всего появились библиографические (реферативные, справочные) БД. По мере накопления опыта и появления потребно­стей в электронных изданиях стали выходить полнотекстовые БД, а также статистические сборники, указатели, словари, справочники и прочие виды информации, образующие сегодняшний рынок разно­образных информационных ресурсов.

Службы — генераторы БД

Машиночитаемая форма записи начала входить в информацион­ную практику в начале 1960-х гг. применительно к библиографичес­кой информации. За последующее десятилетие суммарный объем библиографических БД достиг 50 млн. записей при ежегодном при­росте от 4 до 8 млн библиографических описаний.

В период с 1982 по 1988 г. число БД выросло более чем в 5 раз, при этом количество записей (т.е. суммарный объем БД) увеличилось в 8 раз, а число ежегодно проводимых поисков составило в 1988 г. 26,5 млн. против 7,5 млн. в 1982 г., т.е. выросло более чем в 3,5 раза. В 1995 г. в мире насчитывалось более 8 тыс. общедоступных БД, в том числе порядка 1 тыс. баз — полнотекстовых.

В табл. 22.2 приведены данные по некоторым наиболее продук­тивным службам как широкого, так и узкоспециализированного профиля.

Службы-генераторы используют различные принципы распреде­ления работ по обработке документов. Система INSPEC является системой централизованной обработки, INIS децентрализован­ной. Существуют промежуточные варианты. Например, система CAS (Chemical Abstract Service), первоначально являясь централизованной системой, в дальнейшем заключила ряд соглашений с европейскими и японскими химическими обществами о кооперации, в результате чего почти 1/3 всех входных документов CAS обрабатывается за пре­делами США.

Информационная служба по физике, электронике, кибернетике INSPEC

В 1899 г. общество инженеров-телеграфистов Великобритании было преобразовано в Институт инженеров-электриков (IEE), кото­рый начал издавать РЖ Science Abstract. С 1903 г. РЖ выходит в виде двух серий: А — «Рефераты по физике» (Physics Abstracs — РА), В — «Рефераты по электротехнике» (Electrical Engineering Abstracts ЕЕА), а с 1966 г. вышла третья серия — С — «Рефераты по кибернетике»

(Computer and Control Abstracts CCA). С 1980-х гг. выпускается се­рия D «Информационные технологии» (Information technology). В 1966 г. в IEE было создано отделение INSPEC, ориентированное на автоматизацию подготовки РЖ. Разработка пакетов программ, функ­ционирующих в INSPEC, выполнена фирмой ICL. Существующая структура системы действует с 1969г.

База данных информационного центра INSPEC содержит более 7,5 млн записей и увеличивается более чем на 300 тыс. записей еже­годно. Источниками информации являются научно-технические журналы (более 5000), материалы конференций (около 1200), книги, отчеты, диссертации и другие публикации, выходящие на различных языках.

Перечислим основные выходные продукты INSPEC (табл. 22.3).

Science Abstracts, выпускаемый также на MJI и компакт-дисках, содержит в каждой статье практически те же поля, что и INIS, за исключением списка дескрипторов. Машиночитаемые БД допуска­ют поиск по дескрипторам, а также содержат индексы химических соединений, температурных и энергетических диапазонов, давлений и других физико-химических параметров, имеющих отношение к первоисточнику.

Current Papers (сигнальная информация) — текущие оповещения о публикациях. Каждая запись потока представляет собой сокращен­ный формат РЖ (отсутствует реферат).

Key Abstracts (основные рефераты). Данный информационный поток состоит из 22 тематических серий, выходящих ежемесячно и содержащих рефераты около 250 статей, выбранных из ведущих жур­налов.

Topics (стандартные профили ИРИ). Выпускается около 70 серий, тематическое содержание которых постоянно уточняется. Выпуск осуществляется 2 раза в месяц. Серии (профили) группируются в восемь направлений: коммуникации; ЭВМ и вычисления; электро­ника; геофизика; обработка и представление изображений; науки о материалах; оптика и лазерные технологии; энергетика.

SDI (избирательное распределение информации). Профили на­страиваются на пользователя при участии специалистов INSPEC.

В табл. 22.4 (ниже) приведены интегральные характеристики ряда БД: ретроспективность, объем накопленных записей (в млн экз.), тема­тика, частота обновления (Н — еженедельно, Д — ежедневно, М — ежемесячно, К — ежеквартально, 2Н — раз в 2 недели), а также стои­мостные характеристики при доступе через хост-службу Dialog (стои­мость 1 ч соединения с системой, просмотра одного документа, обслуживания в режиме избирательного распределения информа­ции).

Как видно из табл. 22.4, тематико-видовой охват, глубина ретро­спективности и мощности информационных потоков различных БД, так же как и состав, и структура перечней форматных и текстовых полей документов, очень разнообразны. Это создает большие воз­можности для использования различными потребителями информа­ции.