Fight Image Spam With FuzzyOCR And SpamAssassin On Debian Lenny

Борьба со спам-изображениями с помощью FuzzyOCR и SpamAssassin в Debian Lenny
Этот руководство описывает, как сканировать электронную почту на спам-изображения с помощью FuzzyOCR на сервере под управлением Debian Lenny. FuzzyOCR — это плагин для SpamAssassin, отслеживающий груду непрошенных писем, содержащих изображения как основной носитель информации. Используя различные методы, он анализирует содержимое и свойства изображений, чтобы отделить нормальные письма от спама. FuzzyOCR пытается не загружать систему, сканируя только те сообщения, которые SpamAssassin не пометил как спам, это помогает избежать ненужной работы.
Я не гарантирую, что у Вас это заработает так же, как у меня!
1. Предварительные замечания.
В этой статье я использую в качестве основной системы Debian Lenny.
Примем, что SpamAssassin уже установлен и работает, а в качестве основного каталога конфигурации задан /etc/mail/spamassassin/. Если у вас другой каталог (например, если у вас установлен ISPConfig 2, каталогом будет /home/admispconfig/ispconfig/tools/spamassassin/etc/mail/spamassassin/), то это не проблема. Я отмечу, где что нужно изменить.
Пожалуйста, проверьте, что ваша версия SpamAssassin работает с FuzzyOCR. Для примера, версия FuzzyOCR, установленная здесь (fuzzyocr-3.5.1-devel.tar.gz) требует SpamAssassin 3.1.4 или выше.
2. Установка зависимостей для FuzzyOCR
У FuzzyOCR есть предварительные требования, типа ocrad и gocr, которые мы можем вот так установить:
aptitude install netpbm gifsicle libungif-bin gocr ocrad libstring-approx-perl libmldbm-sync-perl imagemagick tesseract-ocr
Popularity: 1%
Этот материал находится на сайте http://compiling.ru
Оставьте свой отзыв