Misc/bsfilter のバックアップソース(No.1)

#contents

bogofilterはえらく失敗するので、日本の方が作った(?)bsfilterを使ってみる。Spamassasinも気になるのだが何かが気に入らなかったようだ…

*インストール [#v144d9f1]

 sudo apt-get install bsfilter

参考は[[bsfilter / bayesian spam filter / ベイジアン スパム フィルタ:http://bsfilter.org/]]

*学習 [#d5319502]

 bsfilter --add-clean ~/Maildir/.xxx/cur/*
 bsfilter --add-spam ~/Maildir/.xxx/cur/*
 
 bsfilter -u

十数万件サンプル持ってはいるが、そんなに読ませても特に意味はない(むしろ誤判定が増えるような?データの所持数とか関係してるのかしらん)5000件程度がよいくらいかなと思う。

*.mailfilter追記 [#p520f4b4]

 # bsfilter
 xfilter "/usr/bin/bsfilter --homedir xxxx/.bsfilter --pipe --insert-flag  \--insert-probability --auto-update"

~--homedir を指定しておかないと学習結果が反映されないような気がする

*学習反映スクリプト [#i45c036a]

-auto-relearn.sh

 #!/bin/sh

 /usr/bin/bsfilter -sCu --imap --ssl --homedir /home/jp/.bsfilter \
 --insert-flag --insert-probability \
 --imap-folder-spam inbox.Bsfilter_Junk inbox.Bsfilter_LearnSpam

直接移動するのではなく、bsfilterのIMAPアクセス機能を使って処理。

**cron [#z757fd9e]

 0 * * * * /home/jp/bin/auto-relearn.sh > /dev/null 2> /dev/null

それなりに時間かかるので一時間に一回回すようにする。

*参考サイト [#abb9a3a3]

-[[bsfilter / bayesian spam filter / ベイジアン スパム フィルタ:http://bsfilter.org/]]


注意)このバージョンのsafariではjavascriptがうまく動作しないので、recaptchaはページ切り替え版を利用しています。
トップ 一覧 検索 最終更新 バックアップ   ヘルプ   最終更新のRSS