Страница 1 из 1

непонятка с bayes

Добавлено: 2008-12-12 10:29:14
S
в конец мозг вывихнул, фря 7, SpamAssassin 3.2.5. из портов, запускается демоном. даже работает, но:
берём одно и тоже письмо
сначала делаем так

Код: Выделить всё

gate# spamassassin < 0176.MSG
Content analysis details:   (9.6 points, 5.0 required)

 pts rule name              description
---- ---------------------- --------------------------------------------------
 3.5 BAYES_99               BODY: Bayesian spam probability is 99 to 100%
                            [score: 1.0000]
 3.6 HEAD_ILLEGAL_CHARS     Headers have too many raw illegal characters
 0.0 HTML_MESSAGE           BODY: HTML included in message
 1.5 RAZOR2_CF_RANGE_E4_51_100 Razor2 gives engine 4 confidence level
                            above 50%
                            [cf: 100]
 0.5 RAZOR2_CHECK           Listed in Razor2 (http://razor.sf.net/)
 0.5 RAZOR2_CF_RANGE_51_100 Razor2 gives confidence level above 50%
                            [cf: 100]

потом так

Код: Выделить всё

gate# spamc < 0176.MSG
Content analysis details:   (6.2 points, 5.0 required)

 pts rule name              description
---- ---------------------- --------------------------------------------------
 3.7 HEAD_ILLEGAL_CHARS     Headers have too many raw illegal characters
 0.0 HTML_MESSAGE           BODY: HTML included in message
 1.5 RAZOR2_CF_RANGE_E4_51_100 Razor2 gives engine 4 confidence level
                            above 50%
                            [cf: 100]
 0.5 RAZOR2_CHECK           Listed in Razor2 (http://razor.sf.net/)
 0.5 RAZOR2_CF_RANGE_51_100 Razor2 gives confidence level above 50%
                            [cf: 100]
вопрос: откуда разница?
вот кусок конфы:

Код: Выделить всё

use_bayes 1
bayes_path /var/sa_bayes/sa_bayes
bayes_file_mode 0666
bayes_min_ham_num 100
bayes_min_spam_num 100
Помогите разобраться, а то уже мозг кипит

Re: непонятка с bayes

Добавлено: 2008-12-12 11:01:33
terminus
У вас базы натренированны (успели скормить ему 100 писем?), и bayes_auto_learn влючен?

И еще вопрос - почему расположение баз прописано нестандартным? У меня из портов он поставился так, что домашняя директория пользователя spamd, где и храняться базы, прописана как /var/spool/spamd

Re: непонятка с bayes

Добавлено: 2008-12-12 12:07:05
S
terminus писал(а):У вас базы натренированны (успели скормить ему 100 писем?), и bayes_auto_learn влючен?

И еще вопрос - почему расположение баз прописано нестандартным? У меня из портов он поставился так, что домашняя директория пользователя spamd, где и храняться базы, прописана как /var/spool/spamd

Код: Выделить всё

[41799] dbg: bayes: DB journal sync: last sync: 0
[41799] dbg: bayes: corpus size: nspam = 232, nham = 151
[41799] dbg: bayes: score = 1
[41799] dbg: bayes: DB expiry: tokens in DB: 30401, Expiry max size: 150000, Old
est atime: 1226653868, Newest atime: 1229071821, Last expire: 0, Current time: 1
229072673
[41799] dbg: bayes: DB journal sync: last sync: 0
[41799] dbg: learn: auto-learn: currently using scoreset 3, recomputing score ba
sed on scoreset 1
[41799] dbg: learn: auto-learn: message score: 9.284, computed score for autolea
rn: 5.647
[41799] dbg: learn: auto-learn? ham=0.1, spam=12, body-points=5.647, head-points
=5.647, learned-points=3.5
[41799] dbg: learn: auto-learn? no: inside auto-learn thresholds, not considered
 ham or spam
[41799] dbg: check: is spam? score=9.284 required=5
[41799] dbg: check: tests=BAYES_99,DOS_OE_TO_MX,HTML_MESSAGE,RCVD_IN_XBL