Поисковые системы
Поисковые системы – это полностью автоматизированные интерактивные службы поиска информации в Интернете по введенному пользователем текстовому запросу.
Создав и разместив в Интернете веб-сайт, разработчик регистрирует его адрес в поисковой системе, т.е. вносит URL стартовой странички в соответствующее поле на поисковом сервере. Вслед за этим специальная программа поисковой системы, называемая роботом, или спайдером, просматривает данный документ, проходит по всем обнаруженным на нем гиперссылкам и вносит информацию об обнаруженных страницах в базу данных поисковой системы, которая носит название индекса. Этот процесс носит называется индексацией веб-страниц. Как правило, индекс поискового сервера содержит только адреса веб-страниц и краткую аннотацию (70-150 символов), поясняющую их содержимое и почерпнутую из текста самих индексируемых документов. Спустя некоторое время робот автоматически проводит переиндексацию, в ходе которой удаляет из базы данных устаревшие и более недействительные ссылки.
Пользователь, обращаясь к поисковой машине, просто вводит в поле текстового запроса ключевые слова, характеризующие предмет его интересов. После того как он нажмет кнопку «искать», поисковый сервер передает управление другой программе, которая называется поисковым механизмом. Эта программа сравнивает введенные ключевые слова с содержимым индекса, выявляя возможные соответствия. Например, получив запрос «идти», поисковый механизм может расширить диапазон поиска, включив в список ключевых слов глаголы «пойти», «шел», «шла», «пойдет» и т.д. Ссылки, в описании которых обнаруживаются подобные совпадения, автоматически включаются поисковым механизмом в файл отчета, предоставляемый пользователю в виде списка гиперссылок на найденные ресурсы с краткими текстовыми аннотациями для каждой из них. Степень соответствия обнаруженных таким образом ссылок исходному запросу называется релевантностью поиска.
Интерфейс большинства поисковых машин интуитивно понятен даже неподготовленному пользователю. Однако качество работы большинства поисковых систем все же не идеально, и релевантность предоставляемых ими отчетов зачастую оставляет желать лучшего. Поисковый механизм – не живой человек и какие бы совершенные эвристические методы анализа информации он не использовал, понимание многозначности некоторых слов и свойственное нам интуитивное восприятие разговорной речи ему, увы, недоступно. Поэтому в ответ на запрос «закон» вы можете получить и полный текст Гражданского кодекса РК, и формулировку закона всемирного тяготения, и русскую народную пословицу про закс и дышло.
Комментарий к тексту:
Индекс – база данных о проиндексированных роботом документах.
Поисковый механизм – программа, проверяющая содержание индексов в соответствии с запросом пользователя.
Поисковый робот – программа, которая просматривает веб-страницы и считывает их содержимое, следуя по ссылкам, найденным в документах.
Релевантность – степень соответствия обнаруженных ссылок исходному запросу пользователя.
Файл отчета – генерируемый роботом список гиперссылок на найденные ресурсы с краткими аннотациями.
- М.М.Мейрбекова, е.Е.Хайрушева
- Предисловие
- І. В в о д н ы й к у р с
- Язык – достояние общества
- Русские пословицы о языке и речи
- Культура аргументации
- Установка оборудования
- Дискретная математика
- Escape Wireless – это значит свобода!
- Испорченные и зараженные файлы
- Поисковые системы
- II. О с н о в н о й к у р с
- Задание 37. Прочитайте текст. Озаглавьте его.
- Открытие геометрии
- Динамика
- Операционная система и ее назначение
- Клавиатура
- Математическая физика
- Графическое разрешение экрана
- Материнская плата (motherbroard)
- Микропроцессор
- Персональные цифровые помощники
- Хакеры: плохие или хорошие
- Свойства современных языков программирования
- Устойчивость движения
- Алгоритм линейной структуры
- Комплексные числа
- Виды компьютерной графики
- «Красная книга как сигнал опасности»
- Историк науки Рошди Рашед рассказывает о вкладе арабов в развитие математики.
- Структура и содержание реферата
- Обучение писцов
- Своеобразие геометрических построений
- Обучение математике
- Математические тексты
- Философы и математики
- Структура рецензии
- Модель типовой рецензии
- Русскую речь разъедает ржавчина
- У истоков современной науки
- Землемерные работы и картирование неба
- Новые перспективы
- Возникновение академий
- Век Просвещения
- Ш. Культура профессиональной речи
- (Классификация и примеры н.Н.Романовой и а.В.Филипова)
- Каджахметова дана муратбековна
- Тексты для самостоятельной работы
- Математическое моделирование
- Структура файловой системы
- Искусственный интеллект
- Проектирование программы управления кодом
- Омар Хайям. (1048-1131)
- Информация
- Свойства информации
- Paintbrush
- Технология «Виртуальная реальность»
- Факсимильная связь
- Готфрид Вильгельм Лейбниц (1646-1716)
- Рамануджан
- Мориц Паш
- Содержание