logo search
Пособие Технологии сети Интернет

8.3.3. Поисковая система Google

Поисковая система Google (http://www.google.com) была открыта в сентябре 1999 года. На сегодняшний день объем базы составляет более 1 миллиарда документов. Система предлагает пользователю простой и расширенный поисковый интерфейсы, а также страницу создания предустановок поиска (рис. 15).

Рис. 15. Домашняя страница поисковой системы Google

Отличительной особенностью Google является технология определения степени релевантности документа путем анализа ссылок других источников на данный ресурс. Эта технология называется PageRankTM . Чем больше ссылок на какую-либо Web -страницу имеется на других страницах, тем выше ее рейтинг в базе Google . При выдаче результатов поиска в начале списка оказываются страницы с более высоким рейтингом (при прочих равных составляющих).

Помимо основной базы запрос обрабатывается с использованием таких информационных массивов как БД RealNames и каталог Internet-ресурсов Google Web Directory.

Google предоставляет доступ к своей базе другим поисковым системам, среди которых наиболее известными являются Netscape's Search и Yahoo!.

Основными достоинствами системы являются значительный объем базы, маленький список стоп-слов и возможность получения копии документа из базы Google , если он удален с основного адреса.

Поисковая система Google позволяет осуществлять простой и расширенный поиски. При обработке запроса система интерпретирует пробел между словами как логический оператор AND , однако ввод самого оператора не поддерживает. Запрос вводится в поисковое поле. Справа расположены ссылки на страницу "Расширенный поиск" и страницы создания предустановок поиска: "Настройки" и "Языковые инструменты".

Если необходимо провести поиск с использованием стоп-слов, то перед ними проставляется знак "+". Система поддерживает использование логического оператора ОR. Оператор NOT заменяется знаком "-" перед словом без пробела. Возможна постановка знаков "+" и "-" перед фразой.

Поддерживается поиск по фразе. Фраза заключается в кавычки. Помимо кавычек Google учитывает следующие знаки препинания, служащие для связи слов: дефисы, косые черты, знаки равенства, апострофы. При поиске слова, связанные этими знаками, воспринимаются как фраза.

Система не поддерживает поиск с учетом морфологии, поиск по части ключевого слова и не различает строчные и прописные буквы.

При составлении поискового выражения можно использовать два специальных оператора. Оператор link : дает возможность выявить документы со ссылкой на данный URL. Например, на запрос link : www. nlr. ru будут получены документы со ссылками на домашнюю страницу РНБ (Российской национальной библиотеки). Такой запрос нельзя комбинировать с обычными ключевыми словами. Оператор site : сужает круг поиска документами с определенного web -сайта. Например, по запросу site : www. nlr. ru database будут найдены документы на Web -сайте РНБ, содержащие слово "database".

Интерфейс страницы расширенного поиска реализован в виде шаблона, состоящего из фильтров (рис. 16).

Рис. 16. Интерфейс расширенного поиска системы Google

Поисковая система Google определяет степень релевантности документа путем анализа ссылок других источников на данный ресурс. При сортировке результатов поиска из всех релевантных документов выбираются страницы с более высоким рейтингом и помещаются в начало списка.

Перед списком результатов указывается количество документов, найденных по запросу, и время обработки запроса в базе Google

(рис. 17).

Рис. 17. Результаты поиска системы Google

Формат вывода результатов поиска состоит из следующих элементов (рис. 18):

- заголовок документа;

- выдержки из текста с выделенными жирным шрифтом словами запроса;

- описание документа, полученное из поля meta;

- ссылка на соответствующий раздел каталога Google Web Directory;

- URL -адрес страницы;

- размер найденного документа в килобайтах;

- ссылка на копию документа в базе Google;

- ссылка для задания поиска документов, наиболее релевантных данному;

- другие страницы сайта, релевантные запросу, если таковые имеются.

Рис. 18. Формат выдачи результатов поиска системы Google

Оценивая в целом поисковую систему Google, следует отметить, что она предоставляет пользователю разнообразные возможности по настройке интерфейса системы и непосредственно самих поисковых функций. На домашней странице имеется ссылка на страницу создания предустановок поиска: "Настройки" и "Языковые инструменты". Google поддерживает интерфейсы на 43 языках и позволяет открывать каждый найденный документ в новом окне браузера. Пользователь может задать поиск документов одновременно на нескольких языках, регулировать количество результатов поиска, выводимых на одну страницу, а также подключать фильтр для документов, содержащих ненормативную лексику. Созданные предустановки запоминаются браузером и действуют в каждой поисковой сессии, пока не будут изменены.