Ранжирование результата поиска
При поиске для каждого найденного документа Яндекс вычисляет величину релевантности (соответствия) содержания этого документа поисковому запросу. Список найденных документов перед выдачей пользователю сортируется по этой величине в порядке убывания. Релевантность документа зависит от ряда факторов, в том числе от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.
Пользователь может повлиять на порядок сортировки, используя операторы веса и уточнения запроса.
Задание веса слова или выражения применяется для того, чтобы увеличить релевантность документов, cодержащих «взвешенное» выражение. Синтаксис: слово:число или (поисковое_выражение):число
По запросу 'поисковые механизмы:5' будут найдены те же документы, что и по запросу 'поисковые механизмы'. Разница состоит в том, что наверху списка найденного окажутся документы, где чаще встречается именно слово 'механизмы'. Запрос 'поисковые (механизмы | машины | аппараты):5 ' равнозначен запросу 'поисковые (механизмы:5 | машины:5 | аппараты:5)'.
Задание уточняющего слова или выражения применяется для того, чтобы увеличить релевантность документов, содержащих уточняющее выражение. Синтаксис: <- слово или <- (уточняющее_выражение)
По запросу 'компьютер <- телефон' будут найдены все документы, содержащие слово 'компьютер', при этом первыми будут выданы документы, содержащие слово 'телефон'. Если ни в одном документе со словом 'компьютер' нет слова 'телефон', результат запроса будет эквивалентен запросу 'компьютер'.
ЗАДАНИЕ 29. Проверьте справедливость указанных выше правил по ранжированию результатов поиска в поисковых системах Yandex, Rambler, Google, Aport
- Н.А. Борисов, а.А. Лукин
- Подготовлено на кафедре прикладной информатики.
- Введение
- Тема 1. Локальная вычислительная сеть Windows nt
- Работа с Сетевым окружением
- Передвижение в сети
- Доступ к сети с помощью Проводника
- Начало работы
- Тема 2. Программа-браузер ms Internet Explorer
- Выделение ссылок
- Сохранение информации, получаемой с Web-страниц
- Сохранение активной страницы на вашем компьютере
- Сохранение страницы или изображения, не открывая их для просмотра
- Копирование информации со страницы в документ
- Использование изображения из Web-страницы в качестве фонового для рабочего стола
- Сочетания клавиш, используемые в обозревателе Internet Explorer
- Адреса некоторых Web-серверов
- Тема 3. Поиск информации в сети интернет Проблема поиска и средства его организации
- Каталоги и базы данных
- Поисковые системы (поисковые машины, поисковые серверы, поисковые роботы)
- Метапоисковые системы
- Обзор наиболее популярных поисковых систем
- Как выбрать поисковую машину
- 1. Охват и глубина
- 2. Скорость обхода и актуальность ссылок
- 3. Качество поиска (субъективный показатель)
- 4. Скорость поиска
- 5. Поисковые возможности (работа с языком документа, язык запросов)
- 6. Дополнительные удобства
- Тема 4. Правила составления запросов
- Как поисковые машины трактуют слова в запросе?
- Как поисковые машины трактуют некоторые специальные символы в запросе?
- Варианты поиска Тонкий поиск
- Расширенный поиск
- Словарный фильтр
- Сайт/вершина
- Изображение
- Попробуйте использовать язык запросов
- Искать без морфологии
- Поиск картинок и фотографий
- Детальное описание языка запросов Как трактуются слова
- Естественно-языковый поиск
- Основные операторы
- Поиск с расстоянием
- Поиск в зонах
- Поиск в определенных элементах
- Ранжирование результата поиска
- Синтаксис языка запросов (строгий поиск)
- Поиск в элементах
- Советы по проведению поиска
- Тема 5. Работа с почтовой программой Outlook Express
- Тема 6. Связь и организация работы с помощью программы Microsoft Outlook 97
- Основные принципы работы с Outlook
- Литература
- Содержание