8.3.2. Поисковая система Яndex
Доступ к поисковой системе Яndex (http://www.yandex.ru ) был открыт в 1997 году. Поиск осуществляется не только по Web -страницам, но и по специализированным массивам данных, среди которых новости ведущих информационных агентств, товары Internet-магазинов, ресурсы WAP –серверов.
Яndex поддерживает собственный каталог Internet-ресурсов, формирующийся на основе индекса цитирования Яndex'а (CY - Citation Yandex). CY какой-либо Web -страницы измеряется количеством других страниц, содержащих ссылки на эту страницу. Этот метод оценки ресурсов принципиально отличается от простого учета количества посещений страницы.
Яndex имеет простой и расширенный поисковые интерфейсы, а также страницу настройки формата выдачи результатов поиска. Он использует собственную систему обозначений логических операторов, а также поддерживает большое количество поисковых функций.
В верхней части домашней страницы поисковой системы Яndex расположено поле для ввода ключевых слов (рис. 11).
Рис. 11. Домашняя страница поисковой системы Яndex
По умолчанию слова запроса связываются оператором OR. Под поисковым полем приводится пример формулировки запроса, меняющийся при каждом новом открытии страницы простого поиска. Селекторные кнопки снизу позволяют ограничивать поиск следующими областями: "Новости", "Маркет", "Карты", "Словари", "Блоги", "Картинки".
Поиск ключевых слов производится с учетом их морфологии. Если необходимо осуществить поиск по точной словоформе, то перед ним ставится знак "!" без пробела. Система различает слова, набранные строчными и прописными буквами. Поддерживается поиск по фразе, которая заключается в кавычки. Перед ключевым словом допускается постановка знаков "+" и "-", которые заменяют логические операторы AND и NOT соответственно.
Яndex использует собственную систему обозначений логических операторов, которая одновременно позволяет задавать степень близости между ключевыми словами. Логические операторы AND и NOT обозначаются символами "&" и "~" соответственно. Употребление этих символов определяет наличие или отсутствие ключевых слов в отдельном предложении документа.
Для того чтобы подняться от уровня предложения до уровня всего документа, необходимо удвоить символ-оператор. Например, по запросу библиотеки && архивы будут найдены документы, содержащие оба слова без учета расстояния между ними, а по запросу библиотеки & архивы - документы, содержащие оба слова в пределах одного предложения.
Логический оператор OR вводится с помощью символа "|" и действует в пределах всего текста документа. Возможно также употребление круглых скобок для составления сложных поисковых предписаний.
Символ "/" ограничивает максимальное расстояние между ключевыми словами определенным числом. Например, по запросу библиотеки /5 архивы будут найдены документы, в которых расстояние между ключевыми словами не превышает 5 слов. Комбинация символов "/+" позволяет задать расстояние более точно. Так, запросу библиотеки /+2 архивы будут релевантны документы, содержащие фразу "библиотеки, областные архивы".
Также поддерживаются следующие специальные операторы для поиска в определенных областях html -документов:
$title - в заголовке;
$anchor - в тексте ссылок;
#keywords= - в ключевых словах (поле " keywords ");
#abstract= - поиск в описании (поле " META ");
#image= - в имени файла изображения;
#hint= - в подписи к изображению;
#link= - поиск ссылок на заданный URL-адрес;
#url= - поиск документов на заданном сайте (странице).
Интерфейс расширенного поиска системы Яndex представляет собой шаблон, состоящий из поля для ввода ключевых слов, их характеристик по месту расположения и употребления, а также свойств найденных страниц, различающихся по языку, дате и формату (рис. 12).
Рис. 12. Интерфейс расширенного поиска системы Яndex
Результаты поиска выдаются в виде заголовка документа, его описания, URL -адреса, а также ссылок на рубрику каталога Internet-ресурсов List.ru , в которую попадает данный документ (рис. 13).
Рис. 13. Результаты поиска системы Яndex
Результаты поиска сортируются по степени релевантности документов запросу и выдаются по 10 документов на страницу (рис.14).
Релевантность документа зависит от ряда факторов, в том числе от частотных характеристик ключевых слов, их близости в тексте документа, а также от веса слова - параметра, который пользователь может задать самостоятельно. Для этого используется символ ":" и определенное число. Например, по запросу "городские архивы″ библиотеки:3 будут найдены документы, содержащие фразу "городские архивы" и слово "библиотеки", но чем чаще в документе встречается слово "библиотеки", тем ближе он окажется к началу списка результатов.
В числе дополнительных возможностей, предлагаемых пользователям поисковой системы Яndex , можно назвать следующие: интеграция с каталогом Internet-ресурсов List.ru , поиск по новостным лентам ведущих информационных агентств, поиск в электронных магазинах и поиск по российским WAP-ресурсам, а также программа "Региональный Яndex".
Рис. 14. Формат выдачи результатов поиска системы Яndex
Поиск по новостным лентам (http://news.yandex.ru) ведущих информационных агентств дает пользователям возможность получить список ссылок на полный текст информационного сообщения на сайте того или иного агентства. Также осуществляется доставка последних новостей по интересующей теме по электронной почте.
Раздел "Яndex.Товары" (http://tovar.yandex.ru) позволяет искать необходимые товары как в онлайновых, так и в обычных магазинах, предоставляющих соответствующую информацию.
Программа "Региональный Яndex" (http://www.yandex.ru/regions.html) была создана благодаря сотрудничеству с региональными каталогами. Теперь можно ограничивать поиск ресурсами выбранного региона (Астрахань, Брянск, Владивосток, Воронеж, Екатеринбург, Иркутск и проч.).
В разделе "Яndex.WAP" (http://wap.yandex.ru) предлагается два вида поиска: по российским WAP-ресурсам и поиск на территории Москвы. Владелец мобильного телефона, указав свое местоположение (станцию метро или улицу), сможет узнать адреса ближайших станций техпомощи и автозаправки, пунктов обмена валюты и банкоматов, гостиниц, театров, кафе и т.п.
- Федеральное агентство по образованию
- Введение
- Глава 1. Протоколы и сервисы internet
- 1.1. Понятие сервиса Internet
- 1.2. Протоколы сервисов Internet
- Методические указания
- Глава 2. Сервис dns – система доменных имен
- 2.1. Назначение сервиса dns
- 2.2. Организация пространства имен
- 2.3. База данных сервера dns
- 2.4. Разрешение имен
- 2.5. Порядок регистрации доменных имен
- Методические указания
- Глава 3. Сервис telnet – управление удаленными компьютерами в терминальном режиме
- 3.1. Назначение сервиса Telnet
- 3.2. Организация работы сервиса Telnet
- Методические указания
- Глава 4. Сервис ftp – система файловых архивов
- 4.1. Назначение сервиса ftp
- 4.2. Организация работы сервиса ftp
- Методические указания
- Глава 5. Сервис usenet – система телеконференций
- 5.1. Назначение сервиса Usenet
- 5.2. Организация подписки на конференции
- 5.3. Организация работы сервиса Usenet
- Методические указания
- Глава 6. Сервис e-mail – электронная почта
- 6.1. Назначение сервиса e-mail
- 6.2. Стандартные функции почтовых клиентов
- 6.2.1. Прием сообщений
- 6.2.2. Локальное хранение сообщений
- 6.2.3. Создание и отправка сообщений
- 6.2.4. Работа с почтовыми вложениями
- 6.2.5. Создание ответных сообщений
- Методические указания
- Глава 7. Сервис www – гипертекстовая система интеграции сетевых ресурсов в единое информационное пространство
- 7.1. Назначение сервиса www
- 7.2. Средства представления Web-документов
- 7.2.1. Язык html
- 7.2.2. Таблицы стилей
- 7.2.3. Сценарии
- 7.2.4. Язык Dynamic html
- 7.2.5. Java-апплеты
- 7.2.6. Технология ActiveX
- 7.2.7. Язык xml
- 7.3. Унифицированные указатели ресурса
- 7.3.1. Схемы и механизмы доступа к ресурсу
- 7.3.2. Схема "mailto:"
- 7.3.3. Схема "ftp:"
- 7.3.4. Схемы "http:" и "https:"
- 7.4. Клиентское программное обеспечение
- 7.5. Стандартные функции Web-клиентов
- 7.5.1. Доступ к различным информационным ресурсам
- 7.5.2. Работа с объектами различного типа
- 7.5.3. Обеспечение навигации
- 7.5.4. Кэширование и управление загрузкой объектов
- 7.6. Дополнительные функции Web-клиентов
- 7.6.1. Поддержка маркеров "cookie"
- 7.6.2. Поддержка Java-апплетов и технологии ActiveX
- 7.7. Протоколы взаимодействия клиента и сервера
- Методические указания
- Глава 8. Сервис se – поисковые системы
- 8.2. Критерии ранжирования документов
- 8.3. Организация поиска документов
- 8.3.1. Основные поисковые системы
- 8.3.2. Поисковая система Яndex
- 8.3.3. Поисковая система Google
- 8.3.4. Поисковая система Rambler
- Методические указания
- Глава 9. Сервис irc – телеконференции реального времени
- 9.1. Назначение сервиса irc
- 9.2. Подключение и настройка mIrc
- 9.3. Команды irc и mIrc
- 9.3.1. Список команд irc и mIrc
- 9.3.2. Работа с никами
- 9.3.3. Работа с каналами
- 9.3.4. Отправка текста
- 9.3.5. Управление каналом
- Методические указания
- Глава 10. Сервис rtvc – видеоконференции реального времени
- 10.1. Назначение сервиса rtvc
- 10.2. Организация видеоконференций
- 10.2.1. Протоколы семейства h.32x
- 10.2.2. Базовая архитектура стандарта h.323
- Контроллер зоны (рис. 34) - это рекомендуемое, но не обязательное устройство, обеспечивающее сетевое управление и исполняющее роль виртуальной телефонной станции.
- 10.2.3. Тенденции развития рекомендаций h.323
- Методические указания
- Литература
- Технологии сети Интернет: протоколы и сервисы