Misc/bsfilter のバックアップ差分(No.1)


 #contents
 
 bogofilterはえらく失敗するので、日本の方が作った(?)bsfilterを使ってみる。Spamassasinも気になるのだが何かが気に入らなかったようだ…
 
 *インストール [#v144d9f1]
 
  sudo apt-get install bsfilter
 
 参考は[[bsfilter / bayesian spam filter / ベイジアン スパム フィルタ:http://bsfilter.org/]]
 
 *学習 [#d5319502]
 
  bsfilter --add-clean ~/Maildir/.xxx/cur/*
  bsfilter --add-spam ~/Maildir/.xxx/cur/*
  
  bsfilter -u
 
 十数万件サンプル持ってはいるが、そんなに読ませても特に意味はない(むしろ誤判定が増えるような?データの所持数とか関係してるのかしらん)5000件程度がよいくらいかなと思う。
 
 *.mailfilter追記 [#p520f4b4]
 
  # bsfilter
  xfilter "/usr/bin/bsfilter --homedir xxxx/.bsfilter --pipe --insert-flag  \--insert-probability --auto-update"
 
 ~--homedir を指定しておかないと学習結果が反映されないような気がする
 
 *学習反映スクリプト [#i45c036a]
 
 -auto-relearn.sh
 
  #!/bin/sh
 
  /usr/bin/bsfilter -sCu --imap --ssl --homedir /home/jp/.bsfilter \
  --insert-flag --insert-probability \
  --imap-folder-spam inbox.Bsfilter_Junk inbox.Bsfilter_LearnSpam
 
 直接移動するのではなく、bsfilterのIMAPアクセス機能を使って処理。
 
 **cron [#z757fd9e]
 
  0 * * * * /home/jp/bin/auto-relearn.sh > /dev/null 2> /dev/null
 
 それなりに時間かかるので一時間に一回回すようにする。
 
 *参考サイト [#abb9a3a3]
 
 -[[bsfilter / bayesian spam filter / ベイジアン スパム フィルタ:http://bsfilter.org/]]
 
 

注意)このバージョンのsafariではjavascriptがうまく動作しないので、recaptchaはページ切り替え版を利用しています。
トップ 一覧 検索 最終更新 バックアップ   ヘルプ   最終更新のRSS