logo
Курс лекций Сети ЭВМ Петров

Поиск информации в сети Internet Поисковые системы

Поисковая система– это система, которая занимается сбором информации о ресурсах Internet и ее систематизацией для того, чтобы упростить пользователю доступ к интересующей его информации.

Поисковые системы обычно состоят из трех компонент:

Принципы определения соответствия запроса найденному документу (релевантности):

  1. Количество слов запроса в текстовом содержимом документа (т.е. в HTML-коде).

  2. Тэги, в которых эти слова располагаются (например, в <title>)

  3. Местоположение искомых слов в документе (например, в начале страницы).

  4. Время – как долго страница находится в базе поискового сервера.

  5. Индекс цитируемости – как много ссылок на данную страницу ведет с других страниц, зарегистрированных в базе поисковой системы.

На запрос пользователя поисковая система формирует упорядоченный список документов в соответствии с перечисленными принципами.