logo search
Информатика

31. Организация поиска данных в Internet

Чтобы найти нужную информацию, пользователь должен задать вопрос (послать запрос) поисковой машине. В ответ выдается список адресов (URL). Механизм действия очень прост, если сделать запрос правильно.

Самое простое — написать в строке запроса одно слово. Однако и здесь следует иметь в виду, что поисковые машины относятся к словам по-разному. Например, русскоязычные системы поиска «Апорт» и «Яндекс» понимают слово во всех его грамматических формах и с учетом этого будут его искать. Эти машины различаются знанием морфологии, что проявляется в их отношении к новым словам. «Апорт» жестко привязан к базовому словарю, а «Яндекс», даже встретив незнакомое слово, действует не только аналогичным образом, но при необходимости автоматически строит гипотезу, опираясь на правила русского языка. Поисковая машина «Рамблер» не работает с морфологией. Вместо этого она предоставляет возможность «расширить» слово, добавив после него звездочку (*) или замыкающий шаблон. В результате будут найдены все словоформы, начинающиеся с этих символов, в том числе и далекие от искомого.

Однако запросив одно слово, пользователь вполне может получить в ответ огромное количество ссылок (если, конечно, это не узкоспециализированный термин). Естественно, что для уточнения предмета поиска необходимо построить запрос из двух-трех слов. Все поисковые машины имеют язык запросов, который включает логические операторы, а также свои дополнительные возможности (как показано в таблице). Подробнее с языком запросов для каждой машины можно ознакомиться на ее сервере. В этом случае включенные в запрос слова будут представлены в ответе наилучшим образом: при наличии документа, в котором все они встречаются, он будет находиться в верхней части списка найденных. Если такого документа нет, то пользователь получит список из слов, по составу наиболее близких к запросу.

Некоторые пособия по поиску в Интернете считают искусством поиска умение составлять булевы выражения и заключать фразы в кавычки. Это, несомненно, полезная техника, и овладение ею необходимо, но далеко не достаточно для того, чтобы искать и находить в Сети необходимую информацию. Практика показывает, что формализовать и автоматизировать эффективность поиска практически невозможно (впрочем, о том же говорит и теория, если, конечно, изучать ее чуть глубже, чем путем заучивания умных слов вроде «релевантность» и «полнота охвата»). Подлинное искусство поиска требует активных умственных действий и принятия решений на каждом шагу. Бесспорно, поиск в Интернете требует определенных навыков, но они вырабатываются непосредственно в процессе работы.

Для повышения эффективности поиска запрос лучше формировать с применением так называемой сложной системы построения запросов. Для каждого сервера она своя, однако базовые операции поддерживаются всеми основными поисковыми системами.