logo search
Лекции по информатике и программированию

Поиск в Internet

«Всемирная паутина» в Internet – это миллионы документов с неструктированной текстовой информацией. Для поиска нужной информации пользователи Internet используют справочные службы, которые можно разделить на две категории универсальные и специализированные.

В универсальных службах поиск осуществляется по ключевым словам. Поисковая система – это комплекс программ и мощных компьютеров, выполняющий следующие функции:

  1. Специальная программа просматривает Web – страницы, выбирает ключевые слова и составляет БД индексов.

  2. Web – сервер принимает от пользователя запрос на поиск и передает его поисковой машине.

  3. Поисковая машина пересматривает базу индексов, составляет список страниц, удовлетворяющих условиям запроса, и возвращает его Web – серверу.

  4. Web –сервер оформляет результаты выполнения запроса и передает их клиенту.

Наиболее известные поисковые системы:

Alta Vista (www.altavista.com);

Info Seek (www.infoseek.com);

Lycos (www.lycos.com);

Рэмблер (www.rambler.ru) и другие.

Специализированные справочные службы – это тематические каталоги, в которых собраны более или менее структурированные сведения об адресах серверов по той или иной тематике.

Страницы поиска

Броузер не занимается поиском. Он принимает от пользователя запрос, обрабатывает и передает соответствующей поисковой системе.

В каждой поисковой системе приняты собственные соглашения и ограничения на условия поиска.

В качестве примера рассмотрим запросы в системе Alta Vista

  1. Несколько слов, набранные через пробел, обозначают запрос, соответствующий логической операции OR (или).

  2. Например, информационные технологии.

  3. Несколько слов, заключенные в кавычки воспринимаются как единое целое.

  4. Слова, соединенные знаком «+» соответствуют логической операции and (и). Слова при этом в найденном документе не обязательно расположены рядом друг с другом.

Эффективность поиска в сети в значительной мере зависит от опыта и кругозора пользователя.