- 2007-09-27 (Thu) 14:44
- report

お久しぶりです。
サーバー移転、多分終わったんですよ。
大変お待たせしました。
あとはゆっくりCSSいじったりしたいと思います。
絵はずいぶん前から描いているキリン装備さんですが、
まだ描き終わっていない。そのうち全身upします。
変わったところ
えーと、今回は構造をあれこれ変えてみました。
不便になった!という点があれば、是非フォームやweb拍手からお知らせくださいね。
トラックバックやめました
ここ半年、spambot以外に使われている気配がない('△')
というわけで、撤去しました。Spamフィルタの育成が終わったらそのうち再設置します。
記事に記入していただいたコメントはもちろんですし、はてブのコメントも定期的に見ていますので、そちらからも記事にフィードバックさせていただいています。有難うございます。
スパムフィルタをNP_SpamBayesJPに
![]()
NP_Blacklist、誤検出がぼちぼちとあったので、変えてみました。学習…どうやるんだろう…が、がんばろう。
シングルカラム中心、トップページは新着記事1件だけ
どのみちそんなに記事書いてないのと、6~7割ぐらいの方がトップページだけ見ているようなので、いっそのこと!とばかりに1件だけ表示にしちゃいました。
その代わり、かなり大きめサイズの絵まで載せられるように。
ポートフォリオ復活
お待たせしました~。
ラクガキ記事のところ、わりと半端無い数の絵が登録されていますので、要注意です('△')
ついでにリンクページも復活(でもまだ編集中)
件数が膨大になってきて、表示がえらいことになるので、バナーはありません。ごめんなさい。
Blogpeople経由の場合は、明らかな商用サイトでなければこちらからも追加させていただいてます。
Hellgate:Londonやりたいんですよ先生
というわけで、Hellgate:London、今、英語版をプレオーダーした人むけのクローズドβが開催中なんですが、うっかりそのチケットのために私も英語版をオーダーしようか悩んでいます…。クレジットカード使わない派なので、海外通販はペイパルで支払いをしているんですが、ペイパルバランスを販売しているお店が最近減ってきているみたい?こ、こまった。
ちなみに、Hellgate:Londonは、Diabloというオンラインゲームの火付け役なゲームがあるんですが、
それの開発者の方々の最新作。動画とか評判とか上がり始めたんですが(尚、オフィシャルでない動画の方は、現在はNDAがあるため、見つかり次第削除されてるみたい)、めちゃくちゃ爽快そうで気になってます…。女の子キャラもわりと日本人好みに作れそうですよ(・ω・)ノ
最近はなかなか日本に来てくれない洋物オンラインゲームですが、このゲームはバンダイナムコゲームズさんが日本で運営予定。続報心待ちにしております…!
スペック足りないので(今のスペックでも十分動くんですが、せっかくなら綺麗なげれげれを眺めたいわけです)、CPUとグラボを買い換えます。たのしみ。
Comments:12
- 輝竜司 2007-09-27 (Thu) 19:06
-
コメントテスト('△')
- カレイド 2007-09-28 (Fri) 20:30
-
偽コメントテスト('△')
- 輝竜司 2007-09-28 (Fri) 21:13
-
子鬼じゃ、子鬼がおる('△')
ベイジアンフィルタ?、育ってきたのかな、
昨日は自分のコメントが間違ってBANされてたりしてたけど、
だんだん誤検出しなくなってきた('~')ノ - 輝竜司 2007-09-28 (Fri) 21:14
-
と、油断してたらBANされた('△')
- 輝竜司 2007-09-28 (Fri) 23:14
-
hsurさんからコメントいただいたのにspamリストに…orz
----
移転、おつかれさまです。 NP_SpamBayesJPはメニューから「Train HAM (not spam) with all NEW comments」を選ぶと、今まで受け付けたコメントをspamでないものとして一括で学習できますが、もう試されましたか?とりあえず、これをやっておけば自分がspam扱いされることは無いのではないかと思います。あとは必要に応じて「Spam Bayes training」からspamコメントを学習させていけばいいと思いますよ。間違えて学習させてしまったら「Spam Bayes untraining」から学習内容を削除することもできますし。 # やっぱり解説を日本語で書いたほうがいいですよね。。。。。
hsur http://blog.cles.jp - 輝竜司 2007-09-28 (Fri) 23:24
-
有難うございます!何度も投稿していただいて申し訳ありません。
Train HAM (not spam) with all NEW comments、何度か試してみたのですが、
クリック後はオプション画面に最初に表示した時と同じ画面になるのは正しい動作でしょうか?今これぐらい学習しているのですが、まだまだみたいですね…。
が、がんばってきます。
ham 0.96316144095019 61468
spam 0.036838559049813 2351現状でもだいぶがんばってくれているので、
育つのが楽しみです! - hsur 2007-09-29 (Sat) 18:08
-
いえいえ。タイムアウトしたのでちょっとびっくりしました。。。。。
> クリック後はオプション画面に最初に表示した時と同じ画面になるのは正しい動作でしょうか?
はい、正しいです。そのときに画面の下部にある「Baysian DB statistics(spam判別をするための単語データベース)」のwordcount増えていれば問題なく学習されています。
上記で貼ってもらった数字は登録されている単語数の比率を表してます。これを見るとDBに登録されている単語の96.3%はham(spamでない)という情報で、spamの情報は全体の3.6%ということになります。spamのデータがかなり少ないので、このデータにちょっとでもかすってしまうとspam扱いされてしまうのだと思います。
あと確認しておくと便利かなと思うのは、Spam Bayes logにログが溜まっていると思うのですが、そこでactionの部分に「explain」というリンクを押すとこのフィルタがメッセージをどのように評価しているのかがわかりますので参考にしてみてください。
- 輝竜司 2007-10-01 (Mon) 11:35
-
わわ、有難うございます!
今は60%:30%ぐらいまでspamが増えてきました。
ランダムな文字列な物や、「Hello!」みたいなspamはBlackListでは取りこぼしがしばしばあったのですが、それが無いのがいいですね。
あと、「Score at which point we sould consider a text as spam?」の値は何を基準に決めたらよいでしょうか?
デフォルトのままで問題ないでしょうか。 - hsur 2007-10-02 (Tue) 12:08
-
> あと、「Score at which point we sould consider a text as spam?」の値は何を基準に決めたらよいでしょうか?
> デフォルトのままで問題ないでしょうか。基本的にはデフォルト(0.95)で大丈夫です。
これより値を小さくすると判定は厳しめに、大きくすると緩めにすることができるのですが、きちんと学習させたベイジアンははspamでないものはスコアが0に限りなく近く、spamであるものは1に限りなく近い数値をとるようになりますのであまり神経質になる必要はないと思います。 - 輝竜司 2007-10-03 (Wed) 01:07
-
なるほどです、運用開始直後だけ数値を大きくして、様子を見る>育ってきたらデフォルトへ、という感じでいいんですね。
spamへの登録件数が増えるごとに誤検出も減り、いい感じで動いています!
無意味な英字の羅列とかでもちゃんと検出してくれるのがいいですね。
いつも本当にお世話になっております、有難うございます。 - hsur 2007-10-03 (Wed) 19:18
-
>無意味な英字の羅列とかでもちゃんと検出してくれるのがいいですね。
そうですね。NP_Blacklistはフィルタの内容を考えるのが面倒くさかったのですがその手間はなくなりましたよね。
末筆ですが、輝竜さんのレポートものすごい参考になりました。
こちらこそありがとうございます。NP_SpamBayesはドキュメント整備していないので、あんまり普及していないのですが、これからスタンダードになるようにしたいなぁとは思っていますのでこれからもレポートお願いします。
- 輝竜司 2007-10-06 (Sat) 00:34
-
お役に立てていたら嬉しいです、素敵なプラグインを有難うございます!
折を見て記事をまとめてみますね。











