logo search
lavrov / Все практики / Все практики / Реферат Интернет - боты

4 Виды Интернет ботов

Бот в компьютерных играх — компьютерный соперник, имитирующий действия «живого» игрока.

Поиско́вый ро́бот («веб-пау́к», краулер) — программа, являющаяся составной частью поисковой системы и предназначенная для перебора страниц Интернета с целью занесения информации о них в базу данных поисковика. По принципу действия паук напоминает обычный браузер. Он анализирует содержимое страницы, сохраняет его в некотором специальном виде на сервере поисковой машины, которой принадлежит, и отправляется по ссылкам на следующие страницы. Владельцы поисковых машин нередко ограничивают глубину проникновения паука внутрь сайта и максимальный размер сканируемого текста, поэтому чересчур большие сайты могут оказаться не полностью проиндексированными поисковой машиной. Кроме обычных пауков, существуют так называемые «дятлы» — роботы, которые «простукивают» проиндексированный сайт, чтобы определить, что он доступен.

Порядок обхода страниц, частота визитов, защита от зацикливания, а также критерии выделения значимой информации определяются поисковыми алгоритмами.

В большинстве случаев переход от одной страницы к другой осуществляется по ссылкам, содержащимся на первой и последующих страницах.

Также многие поисковые системы предоставляют пользователю возможность самостоятельно добавить сайт в очередь для индексирования. Обычно это существенно ускоряет индексирование сайта, а в случаях, когда никакие внешние ссылки не ведут на сайт, вообще оказывается единственной возможностью указать на его существование.

Ограничить индексацию сайта можно с помощью файла robots.txt, однако некоторые недобросовестные боты могут игнорировать наличие этого файла. Полная защита от индексации может быть обеспечена другими механизмами, например установкой пароля на странице либо требованием заполнить регистрационную форму перед тем, как получить доступ к содержимому.

Одним из самых распространенных Интернет ботов – это Спам.

Спам — массовая рассылка коммерческой, политической и иной рекламы или иного вида сообщений (информации) лицам, не выражавшим желания их получать.

По данным Лаборатории Касперского, в феврале 2010 года почтовый спам в рунете распределился по тематике следующим образом:

18,9 % — образование;

15,7 % — отдых и путешествия;

15,5 % — медикаменты, товары/услуги для здоровья;

9,2 % — компьютерное мошенничество;

6,5 % — компьютеры и Интернет;

5,2 % — реплики элитных товаров;

4,1 % — реклама спамерских услуг;

2,7 % — для взрослых;

2,2 % — недвижимость;

2,2 % — юридические услуги;

1,9 % — личные финансы;

1,4 % — полиграфия.

Выводы

Интернет – боты, как я считал, не только бывают «вредные» но и очень полезные. Они в многом заменяют человеческий труд, приносят 100% верный ответ на поставленную задачу. Выполнение Интернет запросов на которые бы работники потратили значительное время, боты выполняют за считанные секунды. Этим они намного облегчают роботу человеку.

Также подготовив этот доклад я многое узнал о Спаме с которым, как оказывается, сталкиваюсь каждый день в Интернете.

Этим самым обезопасил свой электронный адрес в Интернете от не желательный вредоносных пользователей.

С одним из самых ярких Интернет – ботом я столкнулся на сайте : http://ru.akinator.com. Этот бот тщательно подбирает вопросы для пользователей, после чего их анализируя отгадывает персонажа которого загадал пользователь.