logo search
Билеты по информатике

30. Интернет-технологии: поиск информации

Для поиска информации используются специальные поисковые серверы, которые содержат более или менее полную, и постоянно обновляемую информацию о Web-страницах, файлах и других документах, хранящихся на десятках миллионов серверов Интернета. Различные поисковые серверы могут использовать различные механизмы поиска, хранения и предоставления пользователю информации. Самый быстрый и надежный вид поиска информации в Интернете - поиск по адресам URL. Для этого достаточно запустить программу-браузер и набрать знакомый адрес URL в строке адреса. В Интернете сосредоточено огромное количество документов. Чтобы облегчить поиск нужной информации, создаются специальные поисковые машины (автоматические системы, опрашивающие серверы, подключенные к глобальной сети, и сохраняющие в своей базе информацию об имеющихся на серверах данных). По специальным образом сформулированному запросу поискoвые машины предоставляют информацию о том, где можно получить необходимые данные. Как правило, поисковые машины состоят из трех частей: робота, индекса и программы обработки запроса.

Робот - это программа, которая посещает веб-страницы и считывает (полностью или частично) их содержимое. Индекс - это хранилище данных, в котором сосредоточены копии всех посещенных роботами страниц. Программа обработки запроса - это программа, которая в соответствии с запросом пользователя «просматривает» индекc на предмет наличия нужной информации и возвращает ссылки на найденные документы. Основными характеристиками поисковых машин являются:

* объем документов в индексе;

* частота обновления информации;

* информационное пространство, которое охватывает робот поисковой машины, и разнообразие типов документов, о которых собирается информация;

* скорость обработки запроса;

* критерий определения релевантности (соответствия найденного документа поисковому запросу);

* возможность детализации и уточнения запроса.

Поиск по рубрикатору поисковой системы. Поисковые каталоги представляют собой систематизированную коллекцию (подборку) ссылок на другие ресурсы Интернета. Ссылки организованы в виде тематического рубрикатора, представляющего собой иерархическую структуру, перемещаясь по которой, можно найти нужную информацию.

Большинство поисковых машин имеют возможность поиска по ключевым словам. Для поиска по ключевым словам необходимо ввести в специальном окне слово или несколько слов, которые следует искать, и щелкнуть на кнопке Поиск. Поисковая система найдет в своей базе и покажет документы, содержащие эти слова. Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом.