5.2. Характеристика баз данных
Наиболее многочисленным и важным классом информационных ресурсов в составе информационных технологий являются базы данных (БД). В современном мире практически ни одна автоматизированная система управления не обходится без БД. Базы данных являются основой большинства современных справочных систем, систем автоматизированного ведения бухгалтерского учета, экспертных систем и многих других. Это обусловлено прежде всего простотой и удобством этого типа хранения и извлечения данных.
База данных — упорядоченная организованная совокупность взаимосвязанных данных, предназначенных для хранения, накопления и обработки с помощью ЭВМ. Иначе говоря, это набор данных, который достаточен для достижения установленной цели и представлен на машиночитаемых носителях (магнитная лента, запоминающее устройство, дискета, компакт-диск и т.п.) в виде, позволяющем осуществлять автоматизированную переработку содержащейся в нем информации.
Создание и эксплуатация БД во многом определяют эффективность различных сфер деятельности, начиная от разработки и реализации важнейших решений развития отрасли в целом и кончая удовлетворением индивидуальных запросов руководителей, ученых и специалистов.
Для создания и ведения базы данных (обновления, обеспечения доступа к ним по запросам и выдачи их пользователю) используется набор языковых и программных средств, называемых системой управления базы данных (СУБД).
В зависимости от функционального назначения БД подразделяются на следующие классы:
научно-технической информации;
исследовательские;
учетно-статистические;
справочные;
управленческие;
учебные;
архивные;
др.
В России в настоящее время БД распределены следующим образом: наибольшую долю занимают справочные БД — примерно 51%, БД по научно-технической информации —19%, учебные БД — 15% и исследовательские БД — 15%.
По форме представления информации рассматриваются текстовые, числовые, изобразительные, а также звуковые (аудио) БД. В общем числе БД, представленных на мировом рынке, 70% являются текстовыми. Однако рост числа таких БД и их доля в последние годы снижаются.
По характеру записи текста БД подразделяются на текстовые и гипертекстовые.
По содержанию БД разделены на следующие типы:
документальные (библиографические, реферативные, полнотекстовые, документально-фактографические);
фактографические;
лексикографические;
гипертекстовые.
Документальная БД содержит записи, которые отражают документы и содержат их библиографические описания и, возможно, иную информацию о них. Причем библиографическая БД содержит только библиографическое описание, реферативная БД — библиографические данные и реферат, полнотекстовая БД — полный текст документа или его наиболее информативные части, а документально-фактографическая БД — формальное представление содержания документа.
ФактографическаяI БД — база данных, записи в которой содержат данные о состоянии внешнего мира с учетом ссылок на отражающие их документы. Ее разновидности: объектогра фическая БД (содержит данные об отдельном объекте), база показателей (содержит данные о той или иной характеристике объекта).
ЛексикографическаяII БД объединяет записи, каждая из которых содержит данные об одной лексической единице и соответствует статье словаря.
Гипертекстовая БД включает записи, которые содержат информацию в виде текста на естественном языке и указание на связи их с другими записями, позволяющими компоновать логически связанные фрагменты БД.
Среди упомянутых типов БД в зарубежных информационных системах особенно четко прослеживается тенденция увеличения удельного веса фактографических баз данных, где они составляют около одной трети, а в наиболее крупных информационных фирмах — до 60—70% от общего объема баз данных. В документальных БД все большую долю занимают полнотекстовые базы данных — электронные версии различных изданий. За последние десятилетия они развиваются очень быстрыми темпами и стали важнейшим источником информации во всех областях науки и техники.
По способу доступа БД классифицируют следующим образом:
БД, размещенные в центрах компьютерных сетей (хостах), их еще называют диалоговые, или интерактивные (доступные через компьютерные сети);
БД, тиражируемые в коммуникативных форматах;
БД, тиражируемые с программными средствами (включая CD-ROM);
локальные БД.
Широкое распространение получили БД на CD-ROM (оптических дисках). Объяснение этому — множество достоинств, среди которых: компактность, большой объем памяти для хранения информации, возможность ведения многоаспектного поиска, независимость от внешних факторов (например, сбоев в системе связи), возможность формировать свой фонд машиночитаемых носителей, возможность быстрого поиска необходимого материала по многим признакам. Причем результаты поиска могут быть выведены на печать, скопированы на дискету или жесткий диск.
С технической стороны использование CD-ROM благодаря удобному интерфейсу и отсутствию необходимости подключения к внешним сетям передачи данных представляется более простым делом, чем с удаленными БД.
Несмотря на известные достоинства компакт-дисков, сейчас наблюдается постепенный переход от CD-ROM к онлайновому способу предоставления информации.
Появление и быстрое развитие интерактивных информационных систем (ИИС), которые предоставляют пользователям независимо от их географического положения удаленный доступ к большому числу ИР через терминалы, обусловили появление и значительный рост БД. Использование ИИС в диалоговом режиме обеспечивает следующие возможности:
последовательное уточнение информационного запроса с целью приведения его в соответствие с информационной потребностью;
распознавание и выделение разных типов документов;
просеивание и оценку выдачи документов в процессе поиска и др.
Диалоговый доступ к БД в мире в настоящее время является доминирующим. Услуги диалогового доступа к базам данных представляют собой основной, наиболее динамичный и ведущий вид современных информационных услуг.
В качестве примера ниже приведены некоторые базы данных общего использования.
Библиографическая БД "Российский сводный каталог по научно-технической литературе". Генератор — Государственная публичная научно-техническая библиотека (ГПНТБ). Эта база данных содержит сведения о зарубежных и российских книгах, а также о зарубежных периодических изданиях, поступивших в организации — участницы Автоматизированной системы Российского сводного каталога (АС РСвК).
Объем БД составляет более 530 тыс. записей. Ежегодное пополнение — около 30 тыс. записей по всем видам изданий. Каждая запись в БД содержит кроме библиографического описания на языке оригинала индексы Государственного рубрикатора научно-технической информации (ГРНТИ), коды организаций-фондодержателей. Кроме того, часть записей БД содержит: по зарубежным книгам — перевод заглавий на русском языке, а также предметные рубрики и ключевые слова, по зарубежным периодическим изданиям — аннотацию на русском языке, по российским книгам — аннотацию на русском и (или) английском языках и предметные рубрики.
БД "Продукция предприятий оборонного комплекса". Генератор — Всероссийский научно-исследовательский институт межотраслевой информации (ВИМИ). Содержит сведения о 30 тыс. наименований продукции народнохозяйственного назначения, включая оборудование для переработки сельскохозяйственной продукции, производимой предприятиями оборонной промышленности.
БД "Научно-технические разработки и производственный опыт". Генератор — Российское энергеническое агенство Минэнерго России ("Росинформресурс").
Как показывает анализ мирового опыта, БД являются наиболее перспективной и технологически обеспеченной частью ИР, которые аккумулируют самые различные знания. Они становятся измерителями информационного потенциала страны, а возможность свободного и оперативного доступа к ним — мерой информационности общества.
- 7. Моделирование процессов формирования и распространения информационных ресурсов 102
- 8. Характеристика рынка информационных продуктов и услуг 116
- 9. Потребители информационных ресурсов и их информационные потребности 120
- 10. Источники и поставщики информационных ресурсов 125
- 1. Сущность информации
- 1.1. Основные понятия
- 1.2. Цели получения информации
- 1.3. Носители информации
- 1.3.1. Данные
- 1.3.2. Документы
- 1.3.3. Сигналы
- 3. Сигнал дискретизированный (или дискретный) во времени с непрерывным по размеру параметром (рис. 1.4).
- Вопросы для самоконтроля
- 2. Основные понятия и сущность информационных ресурсов
- 2.1. Определение информационных ресурсов
- 2.2. Информационное описание объекта и формирование информационных ресурсов
- 2.3. Возникновение и развитие информационных ресурсов
- 2.4. Классификация информационных ресурсов
- 2.5. Роль и значение информационных ресурсов в развитии информационных технологий и в информатизации общества
- Вопросы для самоконтроля
- 3. Недокументированные информационные ресурсы
- 3.1. Индивидуальные знания специалистов
- 3.2. Коллективные знания специалистов
- Вопросы для самоконтроля
- 4. Документированные информационные ресурсы
- 4.1. Текстовые (письменные) информационные ресурсы
- 4.2. Характеристика первичных документов, опубликованных в виде издания
- 4.3. Характеристика первичных документов, не опубликованных в виде издания
- 4.4. Характеристика вторичных документов (информационных изданий)
- Вопросы для самоконтроля
- 5. Электронные информационные ресурсы
- 5.1. Общие сведения
- 5.2. Характеристика баз данных
- 5.3. Электронные издания
- 5.4. Мультимедиасистемы
- 5.5. Гипертекстовые системы
- 5.6. Ресурсы Интернета
- 5.6.1. Общие положения
- 5.6.2. Сервисные услуги Интернета
- 5.6.3. Поисковый сервис Интернета
- Вопросы для самоконтроля
- 6. Качество информации и его оценка
- 6.1. Характеристики качества информационных ресурсов
- 6.2. Проблема оценки качества информации и эффективности ее использования
- 6.3. Методика формализованной оценки качества информационных ресурсов и эффективности их использования
- 7. Моделирование процессов формирования и распространения информационных ресурсов 102
- 8. Характеристика рынка информационных продуктов и услуг 116
- 9. Потребители информационных ресурсов и их информационные потребности 120
- 10. Источники и поставщики информационных ресурсов 125
- Лист экспертной оценки эффективности использования информационного ресурса
- 6.4. Пример формализованной оценки качества информационных ресурсов и эффективности их использования
- Лист экспертной оценки эффективности использования информационного ресурса Название: Информационный ресурс х
- Вопросы для самоконтроля
- 7. Моделирование процессов формирования и распространения информационных ресурсов
- 7.1. Формирование единого информационного пространства
- 7.2. Разработка модели организации информационных ресурсов и банка информационных ресурсов
- 7.3. Разработка модели виртуального маршрута и маршрутизации информационных ресурсов
- 7.4. Разработка модели обработки запроса пользователя на получение информационного ресурса
- 7.5. Разработка модели обслуживания заявок на получение информационного ресурса — реализации услуг
- 7.6. Методы формирования и распространения информационных ресурсов
- Вопросы для самоконтроля
- 8. Характеристика рынка информационных продуктов и услуг
- Вопросы для самоконтроля
- 9. Потребители информационных ресурсов и их информационные потребности
- Вопросы для самоконтроля
- 10. Источники и поставщики информационных ресурсов
- 10.1. Общие положения
- 10.2. Источники и поставщики информационных ресурсов для специалистов
- 10.2.1. Источники и поставщики научно-технической отраслевой информации
- 10.2.2. Источники и поставщики патентной информации
- 10.2.3. Источники и поставщики информации по стандартизации, метрологии и сертификации
- 10.2.4. Источники и поставщики информации по статистике
- 10.2.5. Источники и поставщики юридически-правовой информации
- 10.3. Поставщики рыночной информации
- 10.4. Поставщики образовательных информационных ресурсов
- 10.5. Библиотечный фонд
- 10.6. Архивный фонд
- Вопросы для самоконтроля
- 11. Основы правового регулирования на информационном рынке
- Вопросы для самоконтроля
- Какую информацию запрещают к распространению в средствах массовой информации? литература