http://www.joewein.de/sw/spam.htm
SPAM が誘導しようとするドメインのリストを
メンテしてる人がいた。
referer spam とかが邪魔くさいので、自分でも
リストを作ってるけど、これを使うほうが良さげだな。
自分でコツコツ作ってるリストの一部 --> [2005-03-17-1]
(今はもっと増えてすごい行数になってるけどね)
ちなみにログ解析は awstats を使ってるんだけど、
以下のようなわりと強引な設定で毎日流している。
LogFile="cat /var/log/httpd/access.log.`/bin/date -v-1d +%Y%m%d` | grep -v -f REFERERSPAMLIST |"
このコツコツ作ってるリストと Anti-spam domain blacklist で
配ってるリストを比較してみる。
ブラックリストのテキストのもの
http://www.joewein.de/sw/blacklist/dom-bl.txt
% wc -l dom-bl.txt
62489 dom-bl.txt
6万行以上あるらしい。
これに対して、自前のリストは、
% wc -l mylist
151 mylist
お話にならんな。
自前のリストが、dom-bl.txt に全部含まれてれば、
自前のリストを捨てて、dom-bl.txt に一本化できる。
% comm -12 mylist dom-bl.txt | wc -l
57
残念。
1/3 程度しか一致しなかった。
ちなみに自前のリストは以下。
うちのサーバにきた rejectspam など迷惑ドメインのリスト
http://www.pochi.cc/~sasaki/docs/rejectspamdomain.txt
(ソートはしてない)