logo search
18-29 1 раздел

23. Чем отличаются поисковые каталоги от поисковых указателей? Как формируются первые и вторые?

Поисковые системы

Индексыпрограммы-роботы, которые постоянно обследуют Интернет и заполняют

выдают много ссылок

Плюсы:

Минусы:

www.google.com, www.yandex.ru, www.rambler.ru

Каталоги – базы данных, которые заполняются вручную людьми-экспертами (гидами).

Плюсы:

Минусы:

www.yahoo.com, www.dmoz.org, list.mail.ru, yaca.yandex.ru

Гибридные системы – индекс + каталог.

Поисковые указатели создаются автоматическими средствами при минимуме ручного труда. С одной стороны это дает возможность сравнительно быстро обрабатывать огромные массивы Web-документов и создавать индексы размером в сотни миллионов Web-страниц. С другой стороны, никто не может гарантировать, что наличие в документе слов метан или пропан означает принадлежность документа к органической химии.

Поэтому точность поиска информации в базе данных, заполненных автоматическими средствами, оставляет желать лучшего. Поисковые каталоги, как правило, лишены таких недостатков поисковых указателей, как:

 

• неадекватность ссылок (ссылка ведет к документу, не соответствующему теме поиска);

• неактуальность ссылок (ссылка указывает на документ, которого уже давно нет в природе);

• дублирование ссылок, (несколько ссылок ведут к одинаковым документам, хранящимся в разных местах, или к одному документу, проиндексированному в разные даты).

 

Для оценки качества поиска используют два параметра: коэффициент охвата и коэффициент попадания. Коэффициент охвата показывает, какую часть общемировых ресурсов WWW отражает поисковая система в своих базах данных. Для поисковых каталогов этот коэффициент чрезвычайно низок (доли процента). Для поисковых указателей он сравнительно высок (десятки процентов).

Коэффициент попадания показывает, какая часть ссылок, возвращаемых поисковой системой, действительно соответствует ожиданиям клиента. С ним картина противоположная. Для поисковых каталогов этот коэффициент очень высок, поскольку эти каталоги составляют люди. Он приближается к 100%. Для поисковых указателей этот коэффициент печально низок. Если администрация поискового указателя не принимает специальных мер по поддержанию его актуальности, то этот коэффициент может опускаться до нескольких процентов.

Каталоги формируются людьми вручную. Опытный редактор внимательно просматривает сайт, определяет, к какой области знаний относится данный ресурс, устанавливает его категорию в этой отрасли и вносит ресурс в каталог поисковых систем. Самый крупный каталог поисковых систем Интернета — Yahoo (www.yahoo.com). В нем работают более 150 квалифицированных редакторов. Это большая организация, но и ее усилий хватает лишь на то, чтобы поддерживать каталог на уровне примерно 1 миллиона ресурсов. Дальнейшее расширение сдерживается необходимостью поддерживать уровень актуальности. Сегодня редакторы поисковых систем Yahoo! заняты не столько наполнением каталога новыми ресурсами, сколько проверкой актуальности ресурсов, каталогизированных ранее. В российской части Интернета тоже есть несколько каталогов. В недавнем прошлом лучшим считалсякаталог @Rus (www.atrus.ru)