непонятка с bayes

EXIM, sendmail, postfix, Dovecot и прочие. Решение проблем связанных с работой электронной почты

Модератор: xM

Правила форума
Убедительная просьба юзать теги [code] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
S
проходил мимо

непонятка с bayes

Непрочитанное сообщение S » 2008-12-12 10:29:14

в конец мозг вывихнул, фря 7, SpamAssassin 3.2.5. из портов, запускается демоном. даже работает, но:
берём одно и тоже письмо
сначала делаем так

Код: Выделить всё

gate# spamassassin < 0176.MSG
Content analysis details:   (9.6 points, 5.0 required)

 pts rule name              description
---- ---------------------- --------------------------------------------------
 3.5 BAYES_99               BODY: Bayesian spam probability is 99 to 100%
                            [score: 1.0000]
 3.6 HEAD_ILLEGAL_CHARS     Headers have too many raw illegal characters
 0.0 HTML_MESSAGE           BODY: HTML included in message
 1.5 RAZOR2_CF_RANGE_E4_51_100 Razor2 gives engine 4 confidence level
                            above 50%
                            [cf: 100]
 0.5 RAZOR2_CHECK           Listed in Razor2 (http://razor.sf.net/)
 0.5 RAZOR2_CF_RANGE_51_100 Razor2 gives confidence level above 50%
                            [cf: 100]

потом так

Код: Выделить всё

gate# spamc < 0176.MSG
Content analysis details:   (6.2 points, 5.0 required)

 pts rule name              description
---- ---------------------- --------------------------------------------------
 3.7 HEAD_ILLEGAL_CHARS     Headers have too many raw illegal characters
 0.0 HTML_MESSAGE           BODY: HTML included in message
 1.5 RAZOR2_CF_RANGE_E4_51_100 Razor2 gives engine 4 confidence level
                            above 50%
                            [cf: 100]
 0.5 RAZOR2_CHECK           Listed in Razor2 (http://razor.sf.net/)
 0.5 RAZOR2_CF_RANGE_51_100 Razor2 gives confidence level above 50%
                            [cf: 100]
вопрос: откуда разница?
вот кусок конфы:

Код: Выделить всё

use_bayes 1
bayes_path /var/sa_bayes/sa_bayes
bayes_file_mode 0666
bayes_min_ham_num 100
bayes_min_spam_num 100
Помогите разобраться, а то уже мозг кипит

Хостинговая компания Host-Food.ru
Хостинг HostFood.ru
 

Услуги хостинговой компании Host-Food.ru

Хостинг HostFood.ru

Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/

Аватара пользователя
terminus
майор
Сообщения: 2305
Зарегистрирован: 2007-10-29 11:27:35
Откуда: Рига

Re: непонятка с bayes

Непрочитанное сообщение terminus » 2008-12-12 11:01:33

У вас базы натренированны (успели скормить ему 100 писем?), и bayes_auto_learn влючен?

И еще вопрос - почему расположение баз прописано нестандартным? У меня из портов он поставился так, что домашняя директория пользователя spamd, где и храняться базы, прописана как /var/spool/spamd
Модель: AST-PM-105/0044; Тип: Универсальный, ремонтный; Название: Терминус; Род повреждения: Распад функций; Выводы: Сдать на слом.

S
проходил мимо

Re: непонятка с bayes

Непрочитанное сообщение S » 2008-12-12 12:07:05

terminus писал(а):У вас базы натренированны (успели скормить ему 100 писем?), и bayes_auto_learn влючен?

И еще вопрос - почему расположение баз прописано нестандартным? У меня из портов он поставился так, что домашняя директория пользователя spamd, где и храняться базы, прописана как /var/spool/spamd

Код: Выделить всё

[41799] dbg: bayes: DB journal sync: last sync: 0
[41799] dbg: bayes: corpus size: nspam = 232, nham = 151
[41799] dbg: bayes: score = 1
[41799] dbg: bayes: DB expiry: tokens in DB: 30401, Expiry max size: 150000, Old
est atime: 1226653868, Newest atime: 1229071821, Last expire: 0, Current time: 1
229072673
[41799] dbg: bayes: DB journal sync: last sync: 0
[41799] dbg: learn: auto-learn: currently using scoreset 3, recomputing score ba
sed on scoreset 1
[41799] dbg: learn: auto-learn: message score: 9.284, computed score for autolea
rn: 5.647
[41799] dbg: learn: auto-learn? ham=0.1, spam=12, body-points=5.647, head-points
=5.647, learned-points=3.5
[41799] dbg: learn: auto-learn? no: inside auto-learn thresholds, not considered
 ham or spam
[41799] dbg: check: is spam? score=9.284 required=5
[41799] dbg: check: tests=BAYES_99,DOS_OE_TO_MX,HTML_MESSAGE,RCVD_IN_XBL