Процедуры и понятия
Научное сообщество осознало необходимость организационного оформления информационной деятельности, которая в течение нескольких десятилетий подспудно созревала в недрах науки и техники. Большая наука индустриального типа, пришедшая на смену "малой" науке университетского типа, выдвинула задачу создания систем научно-технической информации. Именно в это время, в конце 40-х – начале 50-х годов были сформулированы понятия информационного поиска, информационно-поисковой системы, информационно-поискового языка, была выдвинута задача механизации, а затем и автоматизации информационного поиска. Не случайно именно в это время В. Буш писал о необходимости новых форм справочных материалов, которые учитывали бы ассоциативные связи и были пригодны для механизации.
К этому времени стало ясно, что информационный поиск – это совокупность логических процедур, в результате которых в ответ на информационный запрос выдается либо необходимая информация, либо документы, в которых она может содержаться, либо библиографические адреса этих документов. В первом случае поиск получил название фактографического, во – втором документального, в третьем – библиографического. Эти процедуры сводятся к следующему.
Каждый вновь появляющийся документ подвергается анализу, в результате которого определяется его смысловое содержание. Этот анализ осуществляется интеллектом человека, возможность его формализации остается пока неясной. У автора документа и различных его читателей может быть разное представление о содержании документа. Затем это абстрактное представление о содержании (считается, что оно должно совпадать с авторским) выражается на некотором информационно-поисковом языке, т. е. синтезируется в виде библиографического описания и индекса.
Индекс образуется путем мысленного сопоставления основного смыслового содержания с потенциальными запросами потребителей информации. Эти запросы как бы зафиксированы в схемах классификации и обозначены индексами. Сама процедура выражения основного смыслового содержания документов и информационных запросов на информационно-поисковом языке получила название индексирования и составляет существенную часть аналитико-синтетической обработки документов. Информационный поиск, таким образом, заключается в замене содержательного прочтения полного текста документов формальным сличением (сравнением на соответствие) их поисковых образов с запросами на языке индексов.
Понятно, что такая замена значительно упрощает и убыстряет нахождение нужной информации, делает возможной автоматизацию процедуры сравнения. Но за это приходится платить неполнотой и неточностью поиска. Описанные выше логические процедуры допускают субъективизм осуществляющих их лиц, а используемые информационно‑поисковые языки несовершенны и неспособны адекватно передавать содержание документов и смысл запросов. Следовательно, информационные потери и шум – неизбежные условия информационного поиска. Когда говорят, что поиск осуществлен со 100 %-ной полнотой, имеют в виду, что информационного поиска не производилось, а был осуществлен полный перебор всех текстов (современная технология в некоторых случаях предоставляет такую возможность).
Информационный поиск реализуется при помощи информационно-поисковой системы, которая в абстрактном виде должна состоять из информационно-поискового языка, правил перевода на этот язык и критерия смыслового соответствия, определяющего объем выдачи документов или информации (критерий выдачи). Конкретная система включает также средства реализации (перечень, картотека, механический селектор, компьютер), информационный массив и обслуживающий персонал.
Функционирование простейшей документальной информационно-поисковой системы можно проследить по ее блок-схеме на рис. 9. В системе имеется два входа (для документов и запросов) и один выход (для выдачи документов по запросам). На входах имеются преобразователи для индексирования документов и запросов. Поисковые образы документов вместе с адресами их хранения (номерами) направляются в активное запоминающее устройство (ЗУакт), а сами документы – в пассивное (ЗУпас). Индексы каждого запроса сравниваются с индексами всех документов в решающем устройстве (РУ), которое в случае их соответствия (полного или предусмотренного критерием выдачи) дает в хранилище (ЗУпас) команду на выдачу документа. Это хранилище составляет как бы второй контур системы (сами документы), которого нет у библиографических (одноконтурных) систем.
Активное запоминающее устройство Решающее устройство Индексирование запросов Индексирование документов Пассивное запоминающее устройство Д о к у м е н т ы З а п р о с ы Д о к у м е н т ы Рис. 9. Блок-схема информационно-поисковой системы Документы с адресами Адреса Поисковые образы и адреса
Даже названия элементов на блок-схеме говорят о возможности автоматизации информационно-поисковой системы. Однако блок-схема верно обрисовывает работу любой системы, включая и наиболее традиционные. Это легко видеть на примере библиотеки. Преобразователи на входах соответствуют отделам обработки и справочно-библиографическому, ЗУакт – каталогам, ЗУпас – фондам. Нет в библиотеке только РУ – оно моделируется интеллектом читателя, который (хотя часто он и не осознает этого) вырабатывает собственный критерий выдачи и собственную стратегию поиска.
Не случайно именно эта интеллектуальная часть функционирования информационно-поисковой системы представила наибольшие трудности для автоматизации, именно она больше всего сдерживала развитие этих систем. Камнем преткновения явились, прежде всего, традиционные информационно-поисковые языки, ограничивающие возможности содержательного поиска информации. Расхожее мнение о том, что эти языки трудно поддаются автоматизации, неверно. Но они рассчитаны на ручную реализацию, и поэтому использование их в компьютерах удорожает поиск, ограничивает число пользователей и не дает никаких выигрышей, т. е. не снимает ограничений, присущих этим языкам.
А ограничения эти стали особенно ощутимыми на нынешнем этапе научно-технической революции. Прежде всего, традиционная технология поиска рассчитана на стабильный, медленно меняющийся состав запросов. В схемах классификации и перечнях предметных рубрик уже заранее как бы скоординированы все понятия, по которым можно извлекать информацию из документов и затем производить по ним поиск (такие языки поэтому и получили название предкоординатных). Это приводит к тому, что при возникновении новой проблемы или направления исследований, по которым имеется полученная прежде информация, система не обеспечивает ее поиска. Ведь эта тематика раньше не была сформулирована и не нашла места в схемах классификации и списках предметных рубрик, а значит и индексирование по ней не производилось.
Другими словами, традиционная технология поиска не позволяет искать информацию по любому, заранее не предвиденному сочетанию признаков. При этом, как уже говорилось, субъективизм индексатора при извлечении основного содержания документа увеличивает информационный шум и потери, предопределенные характером традиционных поисковых языков. Нельзя не отметить также, что основанные на них системы ручного поиска, даже фактографические, не предназначены для манипулирования полученными из них данными. Они не имеют логического аппарата для содержательной переработки этих данных. Подобная задача всегда решалась самими потребителями без помощи информационных систем.
- Р. С. Гиляревский основы информатики Курс лекций
- Содержание
- Вводная лекция Информатика как научная дисциплина
- Становление информатики
- Предмет и объекты исследования
- Информатика и другие науки и научные дисциплины
- Информация – знание – наука
- Информация и данные
- Свойства информации
- Структура информации
- Особенности информации
- Информация научная и техническая
- Наука как социальное явление
- Р. Мертон
- М. Поланьи
- К. Поппер
- Перспективы развития науки
- Интеллектуальная коммуникация Основные понятия
- Система научной коммуникации
- Библиотечная и информационная деятельность
- Научно-информационная деятельность
- Этапы и задачи коммуникации
- Информационное обслуживание
- Перспективы развития
- Человек в процессе коммуникации Потребители информации
- Эгалитарность информационного обслуживания
- Информационные потребности в развитии
- Литература как источник информации Основные понятия, эволюция и типология
- Закономерности роста и старения
- Закон рассеяния
- Перспективы развития
- Информационные издания и услуги Основные виды
- Реферирование и библиографирование
- Реферативный журнал винити
- Зарубежные реферативные журналы
- Электронная информация и базы данных
- Сети передачи и средства хранения и обработки данных
- Информационные услуги
- Информационные структуры и инфраструктура
- Информационный поиск Предыстория и сущность
- Процедуры и понятия
- Координатное индексирование
- Цитирование, библиографическое сочетание, социтирование
- Цитирующие документы
- Цитируемые документы
- Иерархические и фасетные классификации
- Рубрикаторы информационных изданий
- Разные типы информационно-поисковых языков
- Базы и банки данных
- Информационные системы Информационно-поисковые системы
- Интеллектуальные информационные системы
- Гипертекстовые системы Возникновение и развитие идеи гипертекста
- Логико-смысловой граф и логика связности
- Гипертекст как развитие функций чтения и письма
- Отечественные гипертекстовые системы гиперлог и семпро
- Системы гипермедиа как развитие гипертекста
- Системы машинного перевода
- Информационная технология о понятии информационной технологии
- Тенденции развития информационных технологий
- Влияние информационных технологий на развитие науки
- Социальные последствия новой технологии
- Компьютерные средства коммуникации Электронные вычислительные машины
- Новые поколения компьютеров
- Персональный компьютер и персональные вычисления
- Работа с текстом на компьютере о языках программирования
- Прикладные программы подготовки текстов
- "Понимание" текста на естественном языке
- Электронная книга Новая концепция книги
- Сущность, особенности и разновидности электронной книги
- Электронный журнал: проблемы распространения и хранения
- Организационные и юридические проблемы
- Электронная библиотека реальная и виртуальная
- Лучше ли электронная книга традиционной печатной? Доводы за электронную книгу
- Доводы против электронной книги
- Заменит ли электронная книга бумажную?
- Сведения об Интернет Интернет как глобальная компьютерная сеть
- Организация доступа к первоисточникам Научно-техническая информация
- Политическая информация
- Новости и литература в электронной форме
- Развлекательная и бытовая информация
- Образование
- Музеи, галереи и художественные выставки
- Информация по Интернет
- Заключительная лекция Идеи и методы информатики
- Поиски фундаментального закона
- Определение и предметная область информатики
- Перспективы информатики
- Словарь терминов