SpamAssassin
Материал из Xgu.ru
Содержание |
[править] Название и терминология
SpamAssassin переводится на русский как убийца спама. Часто можно встретить русское, близкое к оригинальному по звучанию название - СпамОтсосин. По-видимому, такое название указывает на назначение программы - высасывать спам из почтового потока.
Термины, использующиеся в статье:
- spam
- Спам - нежелательная корреспонденция рекламного характера, массово рассылаемая людям, не выразившим желания её получать.
- ham
- Неспам - письма, не являющиеся спамом.
- spammer
- Спаммер - человек (или компьютер), выполняющий рассылку спама.
- blacklist
- Чёрный список
- whitelist
- Белый список
- graylist
- Серый список
[править] Возможности
SpamAssassin для обнаружения спама использует несколько методов:
- Проверка заголовков письма на правильность и соответствие стандартам Интернета
- Проверка заголовков и тела письма на наличие определённых фраз и строк, часто встречающихся в спам-письмах. Проверка может выполняться на нескольких языках.
- Заголовок и тело письма могут проверяться по онлайн-базам, содержащим контрольные суммы спам-сообщений
- IP-адрес отправителя письма может проверяться по онлайн-спискам с адресами известных спаммеров или подозрительных почтовых серверов
- Определённые адреса, хосты или домены могут быть занесены в чёрный или белый список. Белый список может быть создан автоматически, основываясь на истории отправленных сообщений
- SpamAssassin может быть обучен на основе существующей базы спам-сообщений и неспам-сообщений.
- IP-адрес отправителя может быть проверен на то имеет ли он разрешение на отправку писем из этого домена. Проверка выполняется с помощью протокола Sender Policy Framework SPF. (возможность появилась начиная с SpamAssassin 3.0)
- Снижение вероятности классификации письма как спам, полученного от отправителя, который может потратить дополнительную вычислительную мощность при отправке - с помощью системы HashCash. Спаммеры не в состоянии выполнять необходимые вычисления, поскольку они рассылают огромнейшее количество писем одновременно. (возможность появилась начиная с SpamAssassin 3.0)
Методы могут использоваться все сразу или только некоторые из них.
[править] Инсталляция в FreeBSD
Опции при сборке в FreeBSD:
[X] AS_ROOT Run spamd as root (recommended) [ ] DOMAINKEYS DomainKeys support [X] SSL Build with SSL support for spamd/spamc [ ] MYSQL Add MySQL support [ ] PGSQL Add PostreSQL support [X] RAZOR Add Vipul's Razor support [ ] SPF_QUERY Add SPF query support [ ] RELAY_COUNTRY Relay country support [X] TOOLS Install SpamAssassin tools
Назначение опций:
- AS_ROOT
- Запускать процесс spamd от имени пользователя root (рекомендуется).
- DOMAINKEYS
- Поддержка DomainKeys.
- SSL
- Поддежка SSL для spamd и spamc.
- MYSQL
- Поддержка MySQL.
- PGSQL
- Поддержка PostreSQL
- RAZOR
- Поддержка клирингового дома Vipul's Razor.
- SPF_QUERY
- Поддержка запросов SPF.
- RELAY_COUNTRY
- Поддержка relay country
- TOOLS
- Инсталляция дополнительных инструментов SpamAssassin.
[править] Байесовская фильтрация
[править] Принцип байесовской фильтрации
Байесовкая фильтрация базируется на теореме Байеса, открытой им в 1763. Теорема связывает между собой значения априорной и апостериорной вероятности событий.
[править] Конфигурирование
[править] Обучение
$ ls Mail spam goodmail $ sa-learn --mbox --spam Mail/spam $ sa-learn --mbox --ham mail/goodmail $ sa-learn --mbox --ham /var/spool/mail/$LOGNAME
Просмотр результатов обучения:
$ sa-learn --dump data | sort -n 0.000 0 110 1072880922 discussion 0.000 0 112 1071162080 HMBOX-Line:2002 0.000 0 112 1072907632 modify 0.000 0 113 1072915324 H*u:Windows 0.000 0 115 1072900545 Sender ... 1.000 310 0 1071162080 N:HEADER_NBITS 1.000 316 0 1072026198 8-bit 1.000 323 0 1071162080 HEADER_8BITS 1.000 328 0 1072026198 N:N-bit 1.000 394 0 1072910571 Forged
[править] Клиринговые дома
Клиринговые дома, которые в настоящий момент (версия 3.1.3) поддерживает SpamAssassin:
[править] Дополнительная информация
- SpamAssassin - падение продолжается - обсуждение на "Записках антиспамеров"