C#とC++/CLIとVBと.NETとWindowsで戯れる
ストアドでフィルタをかなり利かすようにしたのと、目で全コメントをチェックするようになってほぼSPAMは排除できていると思います。
最終的には目しかないのかな・・・
投稿日時 : 2006年8月18日 12:30
URL書き込み系のスパムであれば "http"の文字の発生回数でブロックするという ルールを書いたことがあります。 SPAMらしさの判定か...
確かに最終的には、目ですね。 アイライトは、すり抜けた分を解析して、 フィルターのアップデートを続けています。
最終的には目でしょうが、ある程度特徴的なものについては自動化出来ますね。メールでもよくやられる手ですがベイジアンを用いる手もありますし。もっとも、日本語の形態素解析はある程度の規模の辞書は要りますから、n-Gramとか使っているのかも知りませんね。 まあ、発信元の情報を使ってブラックリストと対照するのも良く使われますね。MovableTypeのLookupsプラグインは発信元のIPアドレスをブラックリストと対照する方式,Linkプラグインはlink要素を数をカウントする方式ですね。
Powered by: Copyright © 中博俊