Поиск с расстоянием
Часто в запросах ищут устойчивые словосочетания. Если поставить их в кавычки, то будут найдены те документы, в которых эти слова идут строго подряд.
Например, по запросу «красная шапочка» будут найдены документы с это фразой. (При этом контекст «а шапочка у нее была красная» найден не будет.)
Как Яndex адресует слова? Если все слова в тексте перенумеровать по порядку их следования, то расстояние между словами a и b - это разница между номерами слов a и b. Таким образом, расстояние между соседними словами равно 1 (а не 0), а расстояние между соседними словами, стоящими «не в том порядке», равно -1. То же самое относится и к предложениям.
Если между двумя словами поставлен знак '/', за которым сразу напечатано число, значит, требуется, чтобы расстояние между ними не превышало этого числа слов.
Например, задав запрос 'поставщики /2 кофе', вы требуете найти документы, в которых содержатся и слово 'поставщики' и слово 'кофе', причем расстояние между ними должно быть не более двух слов и они должны находиться в одном предложении. (Найдутся "поставщики колумбийского кофе", "поставщики кофе из Колумбии" и т.д.)
Если порядок слов и расстояние точно известны, можно воспользоваться пунктуацией '/+n'. Так, например, задается поиск слов, стоящих подряд.
Запрос 'синяя /+1 борода' означает, что слово 'борода' должно следовать непосредственно за словом 'синяя'. (К тому же результату приведет запрос "синяя борода")
В общем виде ограничение по расстоянию задается при помощи пунктуации вида '/(n m)', где 'n' минимальное, а 'm' максимально допустимое расстояние. Отсюда следует, что запись '/n' эквивалентна '/(-n +n)', а запись '/+n' эквивалентна '/(+n +n)'.
Запрос 'музыкальное /(-2 4) образование' означает, что 'музыкальное' должна находиться от 'образование' в интервале расстояний от 2 слов слева до 4 слов справа
Практически все знаки можно комбинировать с ограничением расстояния.
Например, результатом поиска по запросу 'вакансии ~ /+1 студентов' будут документы, содержащие слово 'вакансии', причем в этих документах слово 'студентов' не следует непосредственно за словом 'вакансии'.
Когда знаки ограничения по расстоянию стоят после двойных операторов, то употребленные там числа - это расстояние не в словах, а в предложениях. Расстояние в абзацах определяется аналогично расстоянию в словах.
Запрос 'банк && /1 налоги' означает, что слово 'налоги' должно находиться в том же самом, либо в соседнем со словом 'банк' предложении.
ЗАДАНИЕ 27. Проверьте справедливость указанных выше правил по поиску с расстоянием в поисковых системах Yandex, Rambler, Google, Aport
Скобки
Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки.
Например, запрос '(история, технология, изготовление) /+1 (сыра, творога)' задает поиск документов, которые содержат любую из фраз 'история сыра', 'технология творога', 'изготовление сыра', 'история творога'.
ЗАДАНИЕ 28. Проверьте справедливость указанных выше правил по использованию в запросе скобок в поисковых системах Yandex, Rambler, Google, Aport
- Н.А. Борисов, а.А. Лукин
- Подготовлено на кафедре прикладной информатики.
- Введение
- Тема 1. Локальная вычислительная сеть Windows nt
- Работа с Сетевым окружением
- Передвижение в сети
- Доступ к сети с помощью Проводника
- Начало работы
- Тема 2. Программа-браузер ms Internet Explorer
- Выделение ссылок
- Сохранение информации, получаемой с Web-страниц
- Сохранение активной страницы на вашем компьютере
- Сохранение страницы или изображения, не открывая их для просмотра
- Копирование информации со страницы в документ
- Использование изображения из Web-страницы в качестве фонового для рабочего стола
- Сочетания клавиш, используемые в обозревателе Internet Explorer
- Адреса некоторых Web-серверов
- Тема 3. Поиск информации в сети интернет Проблема поиска и средства его организации
- Каталоги и базы данных
- Поисковые системы (поисковые машины, поисковые серверы, поисковые роботы)
- Метапоисковые системы
- Обзор наиболее популярных поисковых систем
- Как выбрать поисковую машину
- 1. Охват и глубина
- 2. Скорость обхода и актуальность ссылок
- 3. Качество поиска (субъективный показатель)
- 4. Скорость поиска
- 5. Поисковые возможности (работа с языком документа, язык запросов)
- 6. Дополнительные удобства
- Тема 4. Правила составления запросов
- Как поисковые машины трактуют слова в запросе?
- Как поисковые машины трактуют некоторые специальные символы в запросе?
- Варианты поиска Тонкий поиск
- Расширенный поиск
- Словарный фильтр
- Сайт/вершина
- Изображение
- Попробуйте использовать язык запросов
- Искать без морфологии
- Поиск картинок и фотографий
- Детальное описание языка запросов Как трактуются слова
- Естественно-языковый поиск
- Основные операторы
- Поиск с расстоянием
- Поиск в зонах
- Поиск в определенных элементах
- Ранжирование результата поиска
- Синтаксис языка запросов (строгий поиск)
- Поиск в элементах
- Советы по проведению поиска
- Тема 5. Работа с почтовой программой Outlook Express
- Тема 6. Связь и организация работы с помощью программы Microsoft Outlook 97
- Основные принципы работы с Outlook
- Литература
- Содержание