5月21日

2011/5/21作成

起きて、結果を見てみたらlintは無事に終わってた。タイムスタンプからして、だいたい3時間くらいで終了してたみたい。意外と速いな。これくらいなら、まだチェック内容を追加しても問題なさそう。昔、3DCGの仕事をしてて、重たいシーンデータを扱っていたときのことを思ったら、この程度の処理時間は全然たいしたことはない。

改名実施から一週間経ったので、改名提案一覧から除去しようとしたら、また既に除去されていた。うーん。

lintプログラムの続き。細かい調整を入れて更に検出項目を追加したり、誤検出を減らしたり。それでレポートを眺めてチェックしていくんだけど、我ながらこのプログラムって凄いな。こんな細かなチェック、人間がやれって言われても無理。って、出版社の校正係の人とかはしてるんだろうけど、コンピュータに出来る事は任せたほうが楽だと思う。

更に更にチェック項目を追加していく。どんどん重くなっていくよ。1パスでは処理しきれないので2パスに変更したし。全記事名の一覧が必要になったんで、ます1パス目で記事名を取得し、2パス目でチェックをするというようにした。それでも、なんとか思っていた機能はほぼ実装完了。おおー。おめでとう>自分。ということで、本番データでチェック開始。開始時間は16時。さーて、何時間掛かるかな。もしくは何日掛かるかな、だけど。

と、走らせはじめて30分。カウンタが全然進まないんですけど!!これ、まじで何日のレベルかも。うーん、うーん、うーん。ちょっと考えて、一旦プログラムを止める。極端に遅くなっていると思われる処理を外して再実行。ちょっと、その状態での結果を見てみたいし。完全版については、高速化を検討した方がいいかもしれん。これだけ重いと、ほんの少しの処理変更でも顕著な差が出そうだ。

しかし、こうなると俄然面白くなってきたな。個人的には、プログラムの高速化は大好きだ。極端な話、機能実装するより、それが終わったあとのチューニングの方が好きだ。これほど大規模な案件は久しぶりだし、面白そう。わくわく。

あまゆーずのアルバムはライブでの手売り&通販のみで、一般では売らないそうな。さすがにライブにまで行く気力はないから、通販で買うしかないね。忘れないようにしとかなきゃ。数量限定らしいし。あれ、でもそうするとメジャーレーベルでアルバム発売という「特筆性(音楽)」を満たすか微妙になってくるんじゃないか。インディーズレーベルだとダメらしいから。どこのレーベルから出るんだろう。

プログラムはperlで書いてるんだけど、使っているperlが実は結構古いバージョンなんで、バージョンアップするだけで多少速くなることは期待できるかもしれない。今使っているバージョンがActivePerl 5.8.9 Build 829。なんで今時5.8かというと、Namazuをインストールしようと目論見てたことがあったから。結局Namazuは諦めたので、5.8にこだわる必要もなくなった。

ということで、とりあえずActivePerl 5.12.3 Build 1204のパッケージをダウンロードしてきた。5.14も既に出てたけど、0ナンバーは流石に避けた方がいいかなぁ。perlはだいぶ安心してもいいと思うんだけど、昔5.8.0で凄く痛い目を見たことがあるんで疑心暗鬼。

で、perlのバージョン上げたけど、ほとんど速くならなかった。やっぱり、他人に頼るのはよくないな。自分で頑張らないと。いや、実際には多少速くなってるんだろうけれど、今回の場合は計測誤差の範囲だった、ということで。

おお、ウィキペディア日本語版がもうすぐ75万記事だ。

プログラムを眺めて高速化。速くなることもあるし、思ったより効果がでないこともあるし。色々試して、3倍くらいは速くなったかな。でも、まだまだだな。バグってるところを見つけて直したら遅くなった分もあるし。とりあえず今のバージョンで全件処理してどれくらいか、テスト実行を開始して寝る。


あおやぎのさいと2.0 新人うぃきめでぃあん日記