logo
Gilyarevsky_R_S_Osnovy_informatiki

Информационные системы Информационно-поисковые системы

За последние десятилетия в области информационного поиска произошли важные изменения, которые требуют принципиально новых подходов и решений. В крупных банках данных накоплено огромное количество источников информации. Насчитываются десятки тысяч общедоступных базы данных, в которых содержатся миллиарды записей. В них ежегодно проводятся десятки миллионов информационных поисков. Почти на каждый из них информационно-поисковые системы теперь быстро выдают сотни и тысячи источников, т. е. слишком много, чтобы потребитель был в состоянии все прочитать или хотя бы просмотреть. Поэтому потребитель вынужден ужесточать свои требования к выдаваемым источникам. Возникла возрастающая потребность в значительном усилении критериев выдачи релевантных документов, более строгом их отборе, для чего необходима разработка и применение других принципов, переход на моделирование – пусть вначале даже самое грубое – процессов информационного поиска в памяти человека. Ясно, что поиск информации в памяти человека осуществляется совершенно иначе, чем посредством современных информацион­но‑по­иско­вых систем.

Другой важный фактор, все сильнее воздействующий на сферу информационного поиска, заключается в появлении и росте численности полнотекстовых БД, представляющих собой электронные аналоги печатных изданий и документов – энциклопедий, словарей, справочников, книг, журналов и т. п. Это обусловлено расширяющимся внедрением современных средств вычислительной техники в издательское дело и полиграфию.

Опыт информационного поиска в полнотекстовых БД, когда поиск проводится не по поисковым образам документов, а по их полным текстам, показывает, что использование ключевых слов, встречающихся в полных текстах, не дает тех результатов, которые получаются в первом случае. Хотя использование полных текстов документов создает новые, дополнительные возможности для повышения эффективности поиска (например, благодаря использованию библиографических ссылок как поисковых признаков), стало ясно, что необходима разработка существенно новых принципов информационного поиска по полным текстам документов, основанных на результатах исследования механизмов человеческого мышления и на использовании баз знаний и опыта, накопленного при разработке и эксплуатации экспертных систем, систем машинного перевода и других интеллектуальных информационных систем.

Проблема информационного поиска весьма существенно усложнилась еще в одном отношении. Если раньше объектом поиска были источники информации, то теперь возрастает потребность в поиске самой информации, которая при этом не всегда имеется в поисковом массиве в явном виде. Для получения такой информации необходимо выполнять над текстами источников или записями фактов те или иные логические операции, требующие привлечения определенных знаний о мире, которые непосредственно не содержатся в этих текстах и записях. Такого рода знания отображаются в базах знаний, простейшими примерами которых могут служить информационно-поисковые тезаурусы и таблицы классификации. Кроме того, необходимо учить компьютеры «понимать» тексты и факты, оценивать их, рассуждать, делать логические выводы, формулировать гипотезы, т. е. выполнять многие интеллектуальные операции, при­сущие чело­веческому мозгу. А это становится все более возможным по мере того, как мы узнаем все больше о механизмах человеческого мышления и учимся их моделировать. Таким образом, возрастает потреб­ность в глубоком изучении процессов языкового и логического мышления, в создании и использовании информационно-логических, или интеллектуальных систем, которые сами становятся мощнейшим инструментом исследования этих процессов.