#contents
bogofilterはえらく失敗するので、日本の方が作った(?)bsfilterを使ってみる。Spamassasinも気になるのだが何かが気に入らなかったようだ…
*インストール [#v144d9f1]
sudo apt-get install bsfilter
参考は[[bsfilter / bayesian spam filter / ベイジアン スパム フィルタ:http://bsfilter.org/]]
*学習 [#d5319502]
bsfilter --add-clean ~/Maildir/.xxx/cur/*
bsfilter --add-spam ~/Maildir/.xxx/cur/*
bsfilter -u
十数万件サンプル持ってはいるが、そんなに読ませても特に意味はない(むしろ誤判定が増えるような?データの所持数とか関係してるのかしらん)5000件程度がよいくらいかなと思う。
*.mailfilter追記 [#p520f4b4]
# bsfilter
xfilter "/usr/bin/bsfilter --homedir xxxx/.bsfilter --pipe --insert-flag \
--insert-probability --auto-update"
~--homedir を指定しておかないと学習結果が反映されないような気がする
*学習反映スクリプト [#i45c036a]
-auto-relearn.sh
#!/bin/sh
/usr/bin/bsfilter -sCu --imap --ssl --homedir /home/jp/.bsfilter \
--insert-flag --insert-probability \
--imap-folder-spam inbox.Bsfilter_Junk inbox.Bsfilter_LearnSpam
直接移動するのではなく、bsfilterのIMAPアクセス機能を使って処理。
**cron [#z757fd9e]
0 * * * * /home/jp/bin/auto-relearn.sh > /dev/null 2> /dev/null
それなりに時間かかるので一時間に一回回すようにする。
*参考サイト [#abb9a3a3]
-[[bsfilter / bayesian spam filter / ベイジアン スパム フィルタ:http://bsfilter.org/]]