logo
otvety1

205 Поисковая система в Internet: структура баз, технология пополнения и поиска.

Поисковые системы состоят из трех частей:

- робот — программа, которая посещает web-серверы, считывает и индексирует полностью или частично их содержимое и далее следует по ссылкам, найденным на сервере. Просмотры серверов осуществляются периодически, например раз в месяц, раз в две недели;

- индексные массивы и копии текстов просмотренных страниц, хранящиеся в поисковой с-ме;

- программа, которая, просматривая в соответствии с запросом пользователя индексные массивы, отбирает и выдает потребите­лю найденные документы.

В каталогах имеются иерархические тематические рубрики. Отне­сение серверов к тем или иным рубрикам каталога осуществляется человеком. Пользователь ищет инф-ю в каталоге вручную, ис­пользуя рубрики.

Исследуемое пространство со­стоит из следующих компонентов:

- центральное ядро — тесно связанные между собой web-страни­цы, с каждой из которых можно попасть на любую другую (27 %);

- отправные страницы. В них могут быть ссылки, ведущие к ядру, но из ядра к отправным страницам попасть нельзя (22 %);

- оконечные web-страницы, к которым можно прийти по ссылкам из ядра, но к ядру от них попасть нельзя (22 %);

- полностью изолированные от центрального ядра страницы (22 %); web-страницы, не пересекающиеся с остальными ресурсами Интернета (7 %).

Наилучшим вариантом работы с ИР Интернета является вариант, когда пользователь знает адрес сайта и получает возможность ознакомиться с его содержимым.

Если пользователь исследует новую проблему в бизнесе, ищет инф-ю среди ресурсов, которые он еще не освоил, одним из основ­ных методов является использование поисковых машин и каталогов.

В этом случае может быть предложена следующая технология под­готовки и проведения поиска.