招かれざるモノ

投稿者: | 2007年5月15日

表面には出てこないものの、このブログにも膨大な招かれざるモノが押し寄せてくるわけで。
 昨日movable typeを最新版に更新して、それで急に状況が変わりました。というのも、今回の更新でサーバ内のフォルダ構成を変更したのですが、どうやらそのおかげで迷惑トラックバックが急減しました。
 表示にはほとんど出ないものの、実は膨大な迷惑トラックバックや迷惑コメントがやって来ていました。そのほとんどは、movable typeのSPAMフィルタで却下され、サーバ内で保留扱いにされています。フィルタは例えば、IPによるもの、リンク数によるもの、NGワードによるもの。そんな中にトラックバック送信元のIPと、当該ブログサーバのIPが一致しないのも減点になる、というのがあります。これが結構悪影響して、正当なトラックバックまで保留になることもありますが。
 ま、そんな話はさておき、サーバログを調べる中でわかったのが、User-agentとして違和感のある名前がいくつか出てくるということ。TrackBack/1.6やTrackBack/1.02というものが大量に出てきました。ま、操作性が大きく変わったExcel2007に慣れるためには持ってコイ。ログをExcelに流し込んで、フィルタをかければワッサワッサとこのagentによるアクセスが。このagent名をGoogleなどで検索した結果、案の定迷惑トラックバックと大いに関係がありそう。
log2007.gif
 そして、今回フォルダ構成を変更して分かったのが、どうやらトラックバック用のURLなんかを大量にキャッシュしているんじゃないかということ。フォルダ構成を変更したのに、旧の宛先で大量にトラックバックを試みている。今のところ404というエラーで阻止できていますが、しばらくしたらまた、キャッシュされてすぐに以前のようにスパムがやってくるんでしょうけどね。
 要するに、movable typeのスパム判定に大きく依存し過ぎると誤判定も増えるので、agentで判別して、入口で止めてしまおうかな、と考えています。NGワードはもう数が多くて、逐一新しいのを追加するのも追いつかないし。
 あと、日本語のスパムも増えてきました。キーワードが少しでもヒットするとTBという感じで、「聞き取り調査」という意味で「ヒアリング」と書いていたのに、英語のヒアリング上達の話でTBが来たり。それはまだいい方で、地名があるとその関連でTBが。自分の中で明確に基準を持っているわけではないのですが、さて、どうしましょうかね。
 エントリを読んでTB、コメントしてくださる方には、すぐに反映されなくて違和感があると思いますが、とりあえずは目を背けたくなるような単語が並ぶことだけは避けたいので、じっくりと対策をしておこうかと。