7月6日

2011/7/6作成

ブログの設定作業。なんとか完了して、無事「新人うぃきぺでぃあん日記」公開。よかよか。ただし、リアルタイムでは公開せずに、基本的に1ヶ月遅れで公開することにする。なんでかっていうと、公開の前に見直しをしたいというのと、ウィキペディア上での活動の裏情報みたいになるのは避けたいから。

削除依頼の長期積み残し案件。「3D-Coat」という3Dペイントソフト。この業界から離れて久しいので、全く知らないソフトだけど、一応専門誌サイトでレビューがあったので第三者による言及はあった模様。加えて、調べてみたら英語版とロシア語版の記事があったので、ご当地でも特筆性はあるみたい。ウクライナのソフトなんでウクライナ語版にないのは残念だけど、ウクライナでは国民の大半がロシア語を話せるそうなので、ロシア語版が先に出来ててもおかしくないよね。ということで存続票を投じてみる。

久しぶりにウィキニュースに短信を書く。書いたのは漫画家の和田慎二さん死去の報。短信をせめて1日1本くらいは書きたいなぁと思っているんだけど、なかなか実行に移せないのは、ものぐさな性格によるんだろうねぇ。

jawptool。毎回XMLを全パースするのが問題なんだけど、特に問題なのは記事名一覧を取得するところだよな。ということで、まずは記事名を取得するのにどれだけ時間が掛かっているのか計測してみたところ、約25分となった。結構掛かってるな。一方、記事名一覧をYAMLに出力して、そのYAMLを読み込むのには2分半ほどだった。おお、結構速いな。YAMLデータで45MBもあるんだけどね。ちなみにperlコードにしてperlインタプリタに読み込ませたら30秒ほどだった。これくらいの差ならYAMLでも別に構わないな。

出典の全くない存命人物記事について即時削除を可能とすることについて議論されている。個人的に、削除まではやりすぎだとは思うんだけど、説き伏せることが出来るほどの論拠を持っているわけではない。確かに、正論だからね。

ただ、逆に考えると、出典が一つでもあれば、その記事は存続できるということでもある。ならば、個人的に出典の無い存命人物記事に出典を付けていく作業をしてみよう。ということで、先日作ったリストを基に作業に取り掛かる。

作業内容はいたって単純。その人物名をgoogleニュースで検索して、ヒットして使えそうな記事ならそれを出典として追加するだけ。なんでgoogleニュースかというと、普通にgoogleで検索すると、大抵はウィキペディアの記事がトップに出てくるし、あとは個人ブログとか出典としては使えないものが多くヒットしてしまうから。

しかし、この作業も結構大変だね。だいたい、googleニュースでヒットすることが少ないから、ひたすら検索を繰り返すことになってしまう。これならgoogle APIを使って検索作業を自動化したほうがいいかなと思わなくはないけど、そのためにはアクセス鍵を申請しなきゃいけないし、やりとりはSOAPだから結構面倒だし。ううむ、LWP::UserAgentでお手軽に作ったほうが速いかな。

ということで、googleニュースにリクエストを投げるスクリプトをでっち上げてみたけど、うまく動かんな。どうもキーワードが埋め込んであって、それがないと正常な結果を返さないようになっているっぽい。APIを用意していることだし、そんな単純な仕掛けのスクリプト対策くらいはしているということか。まあ、仕方がないわな。


あおやぎのさいと2.0 新人うぃきめでぃあん日記