Из каких компонентов состоят поисковые системы.
Поисковые системы состоят из следующих основных компонентов:
Spider (паук) - браузероподобная программа, которая скачивает веб-страницы. Spider скачивает веб-страницы тем же способом, что и браузер пользователя. Отличие состоит в том, что браузер отображает информацию, содержащуюся на странице, паук же не имеет никаких визуальных компонент и работает с html-текстом страницы.
Crawler (краулер, «путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Краулер, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.
Indexer (индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Indexer разбирает страницу на составные части и анализирует их. Выделяются и анализируются различные элементы страницы, такие как текст, заголовки, структурные и стилевые особенности, специальные служебные html-теги и т.д.
Database (база данных) – хранилище скачанных и обработанных страниц. Database - это хранилище всех данных, которые поисковая система скачивает и анализирует. Иногда базу данных называют индексом поисковой системы.
Search engine results engine (система выдачи результатов) – извлекает результаты поиска из базы данных. Search Engine Results Engine занимается ранжированием страниц. Она решает, какие страницы удовлетворяют запросу пользователя, и в каком порядке они должны быть отсортированы. Это происходит согласно алгоритмам ранжирования поисковой системы. Эта информация является наиболее ценной и интересной – именно с этим компонентом поисковой системы взаимодействует оптимизатор, пытаясь улучшить позиции сайта в выдаче, поэтому в дальнейшем мы рассмотрим отдельные факторы, влияющие на ранжирование результатов.
Web server (веб-сервер) – веб-сервер, который осуществляет взаимодействие между пользователем и остальными компонентами поисковой системы. Как правило, на нем присутствует html-страница с полем ввода, в котором пользователь может задать интересующий его поисковый термин. Веб-сервер также отвечает за выдачу результатов пользователю в виде html-страницы.
Детальная реализация поисковых механизмов может отличаться друг от друга (например, связка Spider+Crawler+Indexer может быть выполнена в виде единой программы, которая скачивает известные веб-страницы, анализирует их и ищет по ссылкам новые ресурсы), однако всем поисковым системам присущи описанные общие черты.
- Информатизация общества. Роль и значение информационных революций.
- Поколения эвм.
- Системы обработки данных. Пять ключевых признаков сод.
- 4. История организации глобальных компьютерных сетей.
- 5. Технологическая основа Интернет. Технология коммутации пакетов.
- Что такое маршрутизация?
- Взаимодействие основных элементов составляющих Internet.
- Браузеры.
- Портал. Определение. Возможности портала Российское образование.
- Функциональные возможности порталов.
- Классификация порталов.
- Портал. Организация прав доступа. Аутентификация. Авторизация. Что такое контент?
- Электронная почта. Преимущества и недостатки электронной почты.
- Программное обеспечение электронной почты. Серверы и протоколы электронной почты.
- Программное обеспечение электронной почты. Клиентские почтовые программы.
- Поиск информации в Интернет. Инструменты информационного поиска.
- Справочники (каталоги или рубрикаторы). Основные параметры справочников. Для решения каких задач предназначены.
- Поисковые системы. Основные параметры поисковых систем. Для решения каких задач предназначены.
- Из каких компонентов состоят поисковые системы.
- Глобальные справочники ресурсов Интернет. Сравнительный анализ.
- Глобальные поисковые системы. Сравнительный анализ.
- Российские справочники ресурсов Интернет. Сравнительный анализ.
- Российские поисковые системы. Сравнительный анализ.
- Мета-поисковые системы.
- 25 Стратегия и методика профессионального информационного поиска.
- 27 Классы ip-адресов. Идентификаторы сетей. Идентификаторы узлов.
- 29 Подсети. Разделение сети на подсети.
- 30. Основы языка html. Создание списковых элементов. Использование дополнительного форматирования в web-документах.
- 31. Создание таблиц в документах html.
- 32. Создание гиперссылок в документах html
- 33. Использование рисунков в документах html. Элемент карта.
- 34. Мета-данные. Видеофрагменты в документах html.
- 35. Таблицы стилей. Варианты использования таблиц стилей в документах html.
- 36. Язык html. Создание фреймов.
- 37. Язык html. Создание форм.
- 38 Язык сценариев JavaScript. Встраивание скриптов. Основы синтаксиса. Типы переменных. Выражения.
- 39. Иерархия объектов JavaScript. События JavaScript
- 40. Методы alert(), prompt(), conferm() в JavaScript.
- 44. Основные этапы разработки презентаций средствами Microsoft Power Point.