Базы и банки данных
С самого начала в теории информационного поиска предполагалась возможность построения не только информационно-поисковых, но и информационно-логических систем, которые осуществляли бы автоматическую переработку информации, а также извлечение из научных текстов неявно содержавшейся в ней информации. Эту идею много лет назад высказал один из пионеров этой теории в нашей стране В. А. Успенский1. В то время такая возможность связывалась с дальнейшим совершенствованием электронной вычислительной техники, главным образом, с увеличением емкости оперативной памяти компьютеров и их быстродействием, что было вполне понятно. Но подобный ход мысли характерен и в наше время для специалистов в области вычислительной техники. Недаром девизом пятого поколения вычислительных машин служил переход от переработки данных и информации к переработке знаний.
Информатики же давно поняли, что переработка знаний связана не только и даже не столько с совершенствованием компьютеров, сколько с организацией самих этих знаний. В этой сфере до последнего времени господствовали представления, связанные с традиционной структурой научного знания, которое фиксируется в статьях и монографиях и отражается в библиографических бюллетенях и реферативных журналах. Но задача заключается в том, чтобы понять внутреннюю структуру знаний, взаимосвязь данных, фактов, гипотез и теорий.
За последние десятилетия значительное развитие получили исследования в области неклассических логик, баз данных и баз знаний, формализованного представления содержания текстов. Они опираются на достижения математической логики, логической семантики, структурной лингвистики и ряда других фундаментальных и прикладных дисциплин, Результаты этих теоретических исследований находят все большее применение в автоматизации информационных процессов и построении информационных систем различных типов, которые рассматриваются как средство переработки данных и знаний.
В среде информационных работников стало привычным говорить о базах и банках данных (БД и БнД). Само по себе это свидетельствует о том, что профессионалы эффективно используют компьютеры в информационной деятельности. Хуже то, что смысл и значение этих терминов, пришедших из области программирования, понимаются недостаточно глубоко. Это напоминает библиотекарей, которые с появлением теории информационного поиска стали называть каталоги информационно-поисковыми системами, что, в общем-то, верно, но ничего не изменило в традиционной организации каталогов. Так и теперь информационные издания (бюллетени сигнальной информации, реферативные журналы) на магнитной ленте или дискете любят называть базами данных, что тоже не совсем неправильно, но не отражает принципиального смысла этого понятия.
Понятие базы (или банка) данных возникло в конце 60-х гг. в связи с необходимостью освободить программы от данных, которыми они оперируют, сделать их независимыми. До этих пор данные организовывались под нужды каждой конкретной программы, что создавало массу неудобств и затруднений, особенно при изменении данных или самих программ. "База данных это реализованная средствами вычислительной техники специальная система для хранения данных о некотором фрагменте действительности. Главные идеи, лежащие в основе такой системы, – это объединение в одном месте данных, нужных для решения многих задач (может быть, даже тех, которые еще не начинали программироваться) и обеспечение независимости данных от их обработки"1. В процессе развития этого понятия базой данных стала называться и сама совокупность данных, организованных по определенным правилам их описания, хранения и манипулирования ими независимо от прикладных программ.
Появление баз и банков данных оказалось существенным шагом, приблизившим возможность автоматического решения многих интеллектуальных задач. Некоторые специалисты даже сравнивают это достижение с изобретением книгопечатания. Информационные работники со временем стали различать термины "база" и "банк" данных, которые первоначально употреблялись как синонимы. Теперь они понимают под банком данных систему программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного использования данных, а также сами данные, хранимые в виде баз данных. Существует и более ограниченное понимание БнД как одних только программных средств: баз данных, их справочника, системы управления ими (СУБД) и библиотеки запросов и прикладных программ.
Для автоматизированных информационных систем создание банков и баз данных открывает возможность осуществлять информационный поиск не только документов, но и заключенных в них фрагментов – идей и фактов, а также манипулировать ими. Появляется реальная перспектива обогащать собственные наблюдения и результаты исследований ученых всем мировым опытом науки, содержащимся в научно-технической литературе. Значительная часть трудоемкой работы по извлечению и упорядочиванию имеющихся в документах данных, производимая прежде каждым исследователем, в принципе может быть переложена на информационную систему. В концепции банка данных реализуется давняя мечта информационных работников о создании не только автоматизированной информационно-поисковой системы, но и информационно-логической системы, позволяющей осуществлять анализ и синтез научной информации.
Ученый-исследователь и экспериментатор, инженер-разработчик и проектировщик получают возможность оперировать большим, чем до сих пор количеством данных, быстро меняя их организацию. Это можно проиллюстрировать на примере научной работы врачей. Целенаправленное наблюдение и лечение больных, страдающих определенным недугом, получает отражение в историях их болезни. Обычно несколько десятков историй болезни, сопоставленных с данными нескольких десятков литературных источников, служат материалом для написания статьи, и, в конечном счете, кандидатской диссертации. На эту работу уходят годы труда. Несколько сотен историй болезни и литературных источников могут привести к созданию монографии и докторской диссертации, на что приходилось затрачивать значительную часть жизни.
Непосредственный доступ к банку данных позволяет выполнить существенную часть этой работы значительно быстрее. Банк данных облегчает перестройку всевозможных сведений, приведение их к необходимому единообразию, получение статистической информации, поиск зависимостей между параллельными рядами данных. Другими словами, работа с базами данных на компьютере в оперативном режиме устраняет противопоставление поиска информации ее творческой переработке, стирает грань между ними. Происходит как бы диалектический возврат к слиянию этих процессов в деятельности ученого на новом витке развития по спирали.
Было бы неверно думать, что информационные системы уже сегодня готовы к повсеместному переходу на описанный режим работы, хотя и в нашей стране и особенно за рубежом создаются и функционируют автоматизированные системы такого рода. Прежде всего, теория и практика баз и банков данных еще очень молоды и быстро развиваются. Даже наиболее распространенная реляционная ее модель, имеющая ряд преимуществ перед иерархической и сетевой организацией банков данных, как математическая структура реальной действительности далека от совершенства. Именно поэтому разрабатываемые в математической логике модели информационных систем пользуются в информатике таким вниманием. Многообразные задачи, поставленные перед новыми типами информационных систем, называемых теперь интеллектуальными, требуют адекватных средств реализации.
- Р. С. Гиляревский основы информатики Курс лекций
- Содержание
- Вводная лекция Информатика как научная дисциплина
- Становление информатики
- Предмет и объекты исследования
- Информатика и другие науки и научные дисциплины
- Информация – знание – наука
- Информация и данные
- Свойства информации
- Структура информации
- Особенности информации
- Информация научная и техническая
- Наука как социальное явление
- Р. Мертон
- М. Поланьи
- К. Поппер
- Перспективы развития науки
- Интеллектуальная коммуникация Основные понятия
- Система научной коммуникации
- Библиотечная и информационная деятельность
- Научно-информационная деятельность
- Этапы и задачи коммуникации
- Информационное обслуживание
- Перспективы развития
- Человек в процессе коммуникации Потребители информации
- Эгалитарность информационного обслуживания
- Информационные потребности в развитии
- Литература как источник информации Основные понятия, эволюция и типология
- Закономерности роста и старения
- Закон рассеяния
- Перспективы развития
- Информационные издания и услуги Основные виды
- Реферирование и библиографирование
- Реферативный журнал винити
- Зарубежные реферативные журналы
- Электронная информация и базы данных
- Сети передачи и средства хранения и обработки данных
- Информационные услуги
- Информационные структуры и инфраструктура
- Информационный поиск Предыстория и сущность
- Процедуры и понятия
- Координатное индексирование
- Цитирование, библиографическое сочетание, социтирование
- Цитирующие документы
- Цитируемые документы
- Иерархические и фасетные классификации
- Рубрикаторы информационных изданий
- Разные типы информационно-поисковых языков
- Базы и банки данных
- Информационные системы Информационно-поисковые системы
- Интеллектуальные информационные системы
- Гипертекстовые системы Возникновение и развитие идеи гипертекста
- Логико-смысловой граф и логика связности
- Гипертекст как развитие функций чтения и письма
- Отечественные гипертекстовые системы гиперлог и семпро
- Системы гипермедиа как развитие гипертекста
- Системы машинного перевода
- Информационная технология о понятии информационной технологии
- Тенденции развития информационных технологий
- Влияние информационных технологий на развитие науки
- Социальные последствия новой технологии
- Компьютерные средства коммуникации Электронные вычислительные машины
- Новые поколения компьютеров
- Персональный компьютер и персональные вычисления
- Работа с текстом на компьютере о языках программирования
- Прикладные программы подготовки текстов
- "Понимание" текста на естественном языке
- Электронная книга Новая концепция книги
- Сущность, особенности и разновидности электронной книги
- Электронный журнал: проблемы распространения и хранения
- Организационные и юридические проблемы
- Электронная библиотека реальная и виртуальная
- Лучше ли электронная книга традиционной печатной? Доводы за электронную книгу
- Доводы против электронной книги
- Заменит ли электронная книга бумажную?
- Сведения об Интернет Интернет как глобальная компьютерная сеть
- Организация доступа к первоисточникам Научно-техническая информация
- Политическая информация
- Новости и литература в электронной форме
- Развлекательная и бытовая информация
- Образование
- Музеи, галереи и художественные выставки
- Информация по Интернет
- Заключительная лекция Идеи и методы информатики
- Поиски фундаментального закона
- Определение и предметная область информатики
- Перспективы информатики
- Словарь терминов