logo
Отчёты к лабораторным работам / Лабораторная работа 2 / LAB2 Апухтин М

Методы борьбы со спамом

Идеология

Очевидно, что спам приносит экономическую выгоду его заказчикам. Это означает, что пользователи, несмотря на неприязнь к спаму, всё-таки пользуются рекламируемыми посредством спама услугами. До тех пор, пока отдача от спама превышает затраты на преодоление защиты, спам не исчезнет. Таким образом, самым надёжным способом борьбы является отказ от услуг, рекламируемых посредством спама. Встречаются предложения о применении общественного осуждения, вплоть до прекращения общения, против лиц, покупающих рекламируемые спамом товары и услуги.

Другие способы направлены на затруднение спамерам доступа к пользователям.

Превентивные меры защиты

Самый надёжный способ борьбы со спамом — не позволить спамерам узнать электронный адрес. Это трудная задача, но некоторые меры предосторожности можно предпринять.

У всех методик сокрытия адреса есть принципиальный недостаток: они создают неудобства не только предполагаемым спамерам, но и реальным адресатам. К тому же, зачастую адрес опубликовать просто необходимо — например, если это контактный адрес фирмы.

Фильтрация

Поскольку рекламные письма, как правило, сильно отличаются от обычной корреспонденции, распространённым методом борьбы с ними стало отсеивание их из входящего потока почты. На настоящее время этот метод — основной и наиболее широко используемый.

Автоматическая фильтрация

Существует программное обеспечение (ПО) для автоматического определения спама (т. н. спам-фильтры). Оно может быть предназначено для конечных пользователей или для использования на серверах. Это ПО использует два основных подхода.

Первый заключается в том, что анализируется содержание письма и делается вывод, спам это или нет. Письмо, классифицированное как спам, отделяется от прочей корреспонденции: оно может быть помечено, перемещено в другую папку, удалено. Такое ПО может работать как на сервере, так и на компьютере клиента. В последнем случае пользователь не видит отфильтрованного спама, но продолжает нести издержки, связанные с его приемом, так как фильтрующее ПО получает каждое письмо и только потом решает, показывать его или нет. С другой стороны, если ПО работает на сервере, пользователь не несёт издержек по передаче его на свой компьютер, однако, в этом случае пользователь рискует не получить письмо, ошибочно воспринятое фильтром как спам.

Второй подход заключается в том, чтобы, применяя различные методы, опознать отправителя как спамера, не заглядывая в текст письма. Это ПО может работать только на сервере, который непосредственно принимает письма. При таком подходе дополнительный трафик тратится только сервером на общение со спамерскими почтовыми программами (т. е. на отказы принимать письма) и обращения к другим серверам (если таковые нужны) при проверке.

Существуют также специализированные online-сервисы, например, «Лаборатория Касперского» (сервис Kaspersky Hosted Security), Outcom "СПАМОРЕЗ, ИНКАП «Антиспам-Пост», ContrSpam, Антиспамус предоставляющие платную защиту от спама. Изменение MX-записи в доменном имени предприятия особым образом позволяет перенаправить почту для защищаемого домена на специализированный почтовый сервер, где она очищается от спама и вирусов, а затем направляется на корпоративный почтовый сервер. Метод подходит для корпоративных пользователей и не годится для обладателей почтовых ящиков в публичных почтовых системах.

Ещё одна проблема автоматической фильтрации в том, что она может по ошибке отмечать как спам полезные сообщения. Поэтому многие почтовые сервисы и программы по желанию пользователя могут не стирать те сообщения, которые фильтр счёл спамом, а помещать их в отдельную папку.

Методы автоматической фильтрации

Программы автоматической фильтрации используют статистический анализ содержания письма для принятия решения, является ли оно спамом. На практике пользуются популярностью методы байесовской фильтрации спама. Для работы этих методов требуется предварительное «обучение» фильтров путем передачи ему рассортированных вручную писем для выявления статистических особенностей нормальных писем и спама.

Метод очень хорошо работает при сортировке текстовых сообщений (в том числе HTML). После обучения на достаточно большой выборке удаётся отсечь до 95—97 % спама. Для обхода таких фильтров спамеры иногда помещают содержательную часть в картинку, вложенную в письмо, текст же либо отсутствует, либо случаен, что не позволяет фильтру составить статистику для распознавания таких писем. В этом случае необходимо пользоваться программами распознавания текста (большинство современных почтовых программ этого не поддерживают), либо использовать другие методы.

Залог надежной работы байесовского метода — постоянное дообучение фильтра и указание ему на совершаемые ошибки. В почтовых программах для этого вводится возможность ручной пометки сообщения «спам/не-спам», а в почтовых сервисах в интернете — кнопка «пожаловаться на спам».

Неавтоматическая фильтрация

Многие программы и почтовые сервисы в интернете позволяют пользователю задавать собственные фильтры. Такие фильтры могут состоять из слов или, реже, регулярных выражений, в зависимости от наличия или отсутствия которых сообщение попадает или не попадает в мусорный ящик. Однако такая фильтрация трудоёмкая и негибкая, кроме того, требует от пользователя известной степени знакомства с компьютерами. С другой стороны, она позволяет эффективно отсеять часть спама, и пользователь точно знает, какие сообщения будут отсеяны и почему.

Чёрные списки

Чёрный список — перечень физических или юридических лиц, занесёный в соответствующий список, которые по каким-либо причинам признаны недружественными по отношению к субъекту-составителю списка. Сообщения от них могут сразу удаляться или помещаться в папку спам.