logo
Базы знаний интелл

9.3.2. Неспециализированные и специализированные поисковые агенты

Первым уровнем надстройки над поисковыми машинами являются, по-видимому, неспециализированные поисковые агенты. По сути дела, эти компоненты имеются в настоящее время практически у всех машин поиска. Такие агенты, в первую очередь, обеспечивают поиск по ключевым словам и устойчивым словосочетаниям [Delgado, 2000]. Кроме поиска они поддерживают различные и многочисленные сервисы, такие, например, как передача запроса пользователя сразу на множество машин поиска, настройка на личные предпочтения пользователя, формирование тематической базы данных на основе результатов поиска пользователя, а некоторые — и обучение агентов. Не менее важно и то, что такие системы агентов объединяют ссылки на сайты, найденные множеством машин поиска, исключая повторные и неработающие ссылки. Но ни одна из систем данного класса не в состоянии самостоятельно отобрать полезную информацию и оставляет это пользователю. Конечно, используя такие программы, можно уменьшить число результирующих документов, доставляемых обычными машинами поиска. Но степень «попадания ответа в запрос» практически та же, что и у машин поиска. Важно и то, что неспециализированные агенты опыта по поиску в определенной предметной области не накапливают. А обучение, если вообще допускается, занимает много времени.

Специализированные агенты поиска, как следует уже из их названия, приспособлены искать информацию, например, только про музыку, или только про книги, или только про котировки акций и т. д. Большинство таких агентов устроено жестко. Они «умеют» очень хорошо работать на определенных сайтах с фиксированным форматом данных. При этом даже адреса этих сайтов могут быть «зашиты» в агента, например сайты с котировками акций на биржах мира.

Системы, построенные на базе специализированных агентов, кроме поиска предоставляют пользователям определенный пакет средств для организации и управления найденной информацией. Как правило, такие системы содержат набор агентов, каждый из которых ориентирован на поиск информации только по одной теме. Они могут иметь доступ к сотням ресурсов Интернета, включая специализированные базы данных. Основные специализации агентов в таких системах в настоящее время — новости, конференции и группы по интересам, книги, программное обеспечение, электронные магазины и другая бизнес-информация, часто задаваемые вопросы и некоторые другие. Обычно пользователь здесь может сформировать запрос ^системе, используя естественный язык, а результаты сопровождаются аннотациями содержания найденных документов, списками ключевых слов и некоторой другой дополнительной информацией, облегчающей пользователю выделение интересующих его ресурсов. В развитых системах этого класса имеются возможности:

• сохранения параметров поиска для повторного использования, а часто и полной «истории» запросов пользователя;

• параллельного поиска на множестве ресурсов Интернета;

• оформления результатов в виде отчетов (HTML-файлов) и сохранения их в базе данных;

• слежения за обновлением информационных ресурсов Интернета, в том числе с частотой, задаваемой пользователем.

Недостатки у специализированных агентов те же, что и у неспециализированных, но есть и серьезный плюс — четкое срабатывание на хорошо структурированных данных в известном формате.