8.3.3. Поисковая система Google
Поисковая система Google (http://www.google.com) была открыта в сентябре 1999 года. На сегодняшний день объем базы составляет более 1 миллиарда документов. Система предлагает пользователю простой и расширенный поисковый интерфейсы, а также страницу создания предустановок поиска (рис. 15).
Рис. 15. Домашняя страница поисковой системы Google
Отличительной особенностью Google является технология определения степени релевантности документа путем анализа ссылок других источников на данный ресурс. Эта технология называется PageRankTM . Чем больше ссылок на какую-либо Web -страницу имеется на других страницах, тем выше ее рейтинг в базе Google . При выдаче результатов поиска в начале списка оказываются страницы с более высоким рейтингом (при прочих равных составляющих).
Помимо основной базы запрос обрабатывается с использованием таких информационных массивов как БД RealNames и каталог Internet-ресурсов Google Web Directory.
Google предоставляет доступ к своей базе другим поисковым системам, среди которых наиболее известными являются Netscape's Search и Yahoo!.
Основными достоинствами системы являются значительный объем базы, маленький список стоп-слов и возможность получения копии документа из базы Google , если он удален с основного адреса.
Поисковая система Google позволяет осуществлять простой и расширенный поиски. При обработке запроса система интерпретирует пробел между словами как логический оператор AND , однако ввод самого оператора не поддерживает. Запрос вводится в поисковое поле. Справа расположены ссылки на страницу "Расширенный поиск" и страницы создания предустановок поиска: "Настройки" и "Языковые инструменты".
Если необходимо провести поиск с использованием стоп-слов, то перед ними проставляется знак "+". Система поддерживает использование логического оператора ОR. Оператор NOT заменяется знаком "-" перед словом без пробела. Возможна постановка знаков "+" и "-" перед фразой.
Поддерживается поиск по фразе. Фраза заключается в кавычки. Помимо кавычек Google учитывает следующие знаки препинания, служащие для связи слов: дефисы, косые черты, знаки равенства, апострофы. При поиске слова, связанные этими знаками, воспринимаются как фраза.
Система не поддерживает поиск с учетом морфологии, поиск по части ключевого слова и не различает строчные и прописные буквы.
При составлении поискового выражения можно использовать два специальных оператора. Оператор link : дает возможность выявить документы со ссылкой на данный URL. Например, на запрос link : www. nlr. ru будут получены документы со ссылками на домашнюю страницу РНБ (Российской национальной библиотеки). Такой запрос нельзя комбинировать с обычными ключевыми словами. Оператор site : сужает круг поиска документами с определенного web -сайта. Например, по запросу site : www. nlr. ru database будут найдены документы на Web -сайте РНБ, содержащие слово "database".
Интерфейс страницы расширенного поиска реализован в виде шаблона, состоящего из фильтров (рис. 16).
Рис. 16. Интерфейс расширенного поиска системы Google
Поисковая система Google определяет степень релевантности документа путем анализа ссылок других источников на данный ресурс. При сортировке результатов поиска из всех релевантных документов выбираются страницы с более высоким рейтингом и помещаются в начало списка.
Перед списком результатов указывается количество документов, найденных по запросу, и время обработки запроса в базе Google
(рис. 17).
Рис. 17. Результаты поиска системы Google
Формат вывода результатов поиска состоит из следующих элементов (рис. 18):
- заголовок документа;
- выдержки из текста с выделенными жирным шрифтом словами запроса;
- описание документа, полученное из поля meta;
- ссылка на соответствующий раздел каталога Google Web Directory;
- URL -адрес страницы;
- размер найденного документа в килобайтах;
- ссылка на копию документа в базе Google;
- ссылка для задания поиска документов, наиболее релевантных данному;
- другие страницы сайта, релевантные запросу, если таковые имеются.
Рис. 18. Формат выдачи результатов поиска системы Google
Оценивая в целом поисковую систему Google, следует отметить, что она предоставляет пользователю разнообразные возможности по настройке интерфейса системы и непосредственно самих поисковых функций. На домашней странице имеется ссылка на страницу создания предустановок поиска: "Настройки" и "Языковые инструменты". Google поддерживает интерфейсы на 43 языках и позволяет открывать каждый найденный документ в новом окне браузера. Пользователь может задать поиск документов одновременно на нескольких языках, регулировать количество результатов поиска, выводимых на одну страницу, а также подключать фильтр для документов, содержащих ненормативную лексику. Созданные предустановки запоминаются браузером и действуют в каждой поисковой сессии, пока не будут изменены.
- Федеральное агентство по образованию
- Введение
- Глава 1. Протоколы и сервисы internet
- 1.1. Понятие сервиса Internet
- 1.2. Протоколы сервисов Internet
- Методические указания
- Глава 2. Сервис dns – система доменных имен
- 2.1. Назначение сервиса dns
- 2.2. Организация пространства имен
- 2.3. База данных сервера dns
- 2.4. Разрешение имен
- 2.5. Порядок регистрации доменных имен
- Методические указания
- Глава 3. Сервис telnet – управление удаленными компьютерами в терминальном режиме
- 3.1. Назначение сервиса Telnet
- 3.2. Организация работы сервиса Telnet
- Методические указания
- Глава 4. Сервис ftp – система файловых архивов
- 4.1. Назначение сервиса ftp
- 4.2. Организация работы сервиса ftp
- Методические указания
- Глава 5. Сервис usenet – система телеконференций
- 5.1. Назначение сервиса Usenet
- 5.2. Организация подписки на конференции
- 5.3. Организация работы сервиса Usenet
- Методические указания
- Глава 6. Сервис e-mail – электронная почта
- 6.1. Назначение сервиса e-mail
- 6.2. Стандартные функции почтовых клиентов
- 6.2.1. Прием сообщений
- 6.2.2. Локальное хранение сообщений
- 6.2.3. Создание и отправка сообщений
- 6.2.4. Работа с почтовыми вложениями
- 6.2.5. Создание ответных сообщений
- Методические указания
- Глава 7. Сервис www – гипертекстовая система интеграции сетевых ресурсов в единое информационное пространство
- 7.1. Назначение сервиса www
- 7.2. Средства представления Web-документов
- 7.2.1. Язык html
- 7.2.2. Таблицы стилей
- 7.2.3. Сценарии
- 7.2.4. Язык Dynamic html
- 7.2.5. Java-апплеты
- 7.2.6. Технология ActiveX
- 7.2.7. Язык xml
- 7.3. Унифицированные указатели ресурса
- 7.3.1. Схемы и механизмы доступа к ресурсу
- 7.3.2. Схема "mailto:"
- 7.3.3. Схема "ftp:"
- 7.3.4. Схемы "http:" и "https:"
- 7.4. Клиентское программное обеспечение
- 7.5. Стандартные функции Web-клиентов
- 7.5.1. Доступ к различным информационным ресурсам
- 7.5.2. Работа с объектами различного типа
- 7.5.3. Обеспечение навигации
- 7.5.4. Кэширование и управление загрузкой объектов
- 7.6. Дополнительные функции Web-клиентов
- 7.6.1. Поддержка маркеров "cookie"
- 7.6.2. Поддержка Java-апплетов и технологии ActiveX
- 7.7. Протоколы взаимодействия клиента и сервера
- Методические указания
- Глава 8. Сервис se – поисковые системы
- 8.2. Критерии ранжирования документов
- 8.3. Организация поиска документов
- 8.3.1. Основные поисковые системы
- 8.3.2. Поисковая система Яndex
- 8.3.3. Поисковая система Google
- 8.3.4. Поисковая система Rambler
- Методические указания
- Глава 9. Сервис irc – телеконференции реального времени
- 9.1. Назначение сервиса irc
- 9.2. Подключение и настройка mIrc
- 9.3. Команды irc и mIrc
- 9.3.1. Список команд irc и mIrc
- 9.3.2. Работа с никами
- 9.3.3. Работа с каналами
- 9.3.4. Отправка текста
- 9.3.5. Управление каналом
- Методические указания
- Глава 10. Сервис rtvc – видеоконференции реального времени
- 10.1. Назначение сервиса rtvc
- 10.2. Организация видеоконференций
- 10.2.1. Протоколы семейства h.32x
- 10.2.2. Базовая архитектура стандарта h.323
- Контроллер зоны (рис. 34) - это рекомендуемое, но не обязательное устройство, обеспечивающее сетевое управление и исполняющее роль виртуальной телефонной станции.
- 10.2.3. Тенденции развития рекомендаций h.323
- Методические указания
- Литература
- Технологии сети Интернет: протоколы и сервисы