新人うぃきめでぃあん日記:2012年7月

2012年7月1日

ウィキニュースの短信を1本。日本で原発再稼動反対デモ。個人的にこのデモについてはどうかと思うところはあるんだけど、それはそれ。ニュースはニュース。

ウィキペディアのデータベースダンプが更新されたのでダウンロード。それだけ。うむぅ。

2012年7月2日

ウィキニュースの短信を4本。メキシコ大統領選、小沢グループ離党、サッカー欧州選手権スペイン優勝、大飯原発臨界。

と思ったら、民主党の離党者の内2名が撤回したとのニュースが。ということで続報を書く。

更に短信を2本。ミニテルサービス終了、スパコン京完成。

2012年7月3日

ウィキニュースの短信を2本。ロシアで世界最長の斜張橋、マリで世界遺産破壊。

査読を1件。問題なかったので公開。

久しぶりにjawptoolの定例バッチを実行し、レポートも更新した。またしても宣伝ですが、「http://sourceforge.jp/projects/jawptool/」でjawptoolを配布し、「http://jawptool.sourceforge.jp/」で解析結果レポート等を公開しています。

ところでレポートを軽く眺めていて気付いたんだけど、存命人物記事の出典が随分と改善されている。2012年6月30日のダンプで120976記事中出典皆無は70001。比較のために手元にある最古のダンプである2010年3月17日でレポートを取ってみると、85135記事中出典皆無は63309。比率ではそれぞれ57.8%、74.3%。この1年半くらいで15%くらい改善してるね。凄いね。

もちろんこれは0%であるのが望ましいし、更に言えばjawptoolでは出典に関する節があるかどうかだけで判定しているから1個でも出典が付いていれば出典ありと判定しているし、出典に関する節があるだけで中身が空っぽでも出典ありにしている。この辺は機械的に判定しているからしょうがないんだけど。ともかく、出典が少しでも付くようになったのはいいことだよね。

2012年7月4日

ウィキニュースの短信を2本。アメリカで家庭用HIV検査キット承認、サルコジ前大統領違法献金疑惑。

2012年7月5日

ウィキニュースの短信を2本。義足のランナーが五輪へ、インドで洪水。

2012年7月6日

ウィキニュースの短信を1本。EU一のビル落成式。

ウィキペディアの「シャード・ロンドン・ブリッジ」が竣工予定のままの記述だったので、今回のニュースを出典にして竣工済みに修正。

2012年7月7日

ウィキニュースの短信を2本。三峡ダム発電フル稼働、大都市地域特別区設置法案成立へ。

ウィキペディアの「三峡ダム」に発電フル稼働の記述を追加と今回のニュースを出典に追加。

ものすごく久しぶりにjawptoolに手を入れる。しばらくまとまって時間が確保できそうなので、しばらく溜め込んでいた修正のネタを消化しようと思う。

と言っても最初は思い出すだけで一苦労(^^)。修正は曖昧さ回避記事の判定を少し直しただけ。とりあえずはこんなもんでしょ。徐々に思い出していけば。

ところで今回久しぶりにいじっていたら、テストにパスしなくてちょっと焦った。原因は環境変数LANGがja_JP.UTF-8になっていてperlの出力するメッセージが変わっていたというものだったんだけど。うっかりしてた。LANGをCにしてやることで無事にテストをパスするようになったんだけど、そうすると普段の生活環境が不便になるよなぁ。テストスクリプトだけをLANG=Cで動かすようにしたいなぁ。どうやってやるんだろ?単純にテストスクリプトの先頭でsetenvしたらいいのかなぁ。調べなきゃ。

2012年7月8日

ウィキニュースの短信を3本。リビアで半世紀ぶりの国政選挙、ロシア洪水で死者134人、三笠宮さまICUへ。

2012年7月9日

ウィキニュースの短信を2本。アナン氏シリア入り、ロジャー・フェデラーがウィンブルドン制覇。

jawptoolを少しいじる。wiki2html(ウィキテキストをHTMLに変換する付属ツール)をちょこっと修正したりとか。

更にjawptool。リダイレクトかどうかの判定をしている処理がある。リダイレクト記事は'#redirect[[転送先]]'で始まっていないといけないんだけど、なんと'#'の前にホワイトスペース(スペースとかタブとか改行コード)が入っていてもいいんですね、MediaWikiって。そんなことをちーとも知らんかったんで、今回ようやく対応。あと'#転送[[転送先]]'は知ってたけど'#リダイレクト[[転送先]]'とも書けるというのも知ったので、これも対応。それにしても、こんな記法まで対応する必要あるのかなぁ。日本語でこれだけ対応しているということは、他の言語でも同じような対応をしているということだろうから、MediaWikiの内部ではものすごい記述の山になっているのではないだろうか。まあ私が心配することではないんだけれども。

更に更にjawptool。MediaWikiのデータベースダンプはXMLという形式なんだけど、これを解析するのにこれまではかなりいい加減なやっつけコードで処理していた。これはあまりにも醜いということで、今回コードを書き直してみた。と書くとあっさり出来たようだけど、かなり梃子摺ったんだよね。XMLを解析するのって結構面倒で。結局、多少問題の残るコードにはなってしまったんだけど、以前のやっつけよりはよっぽどましということでコードを差し替え。ただ、ちょっと遅くなってしまったのが困ったもんなんだけど。あとで高速化できないか考えてみよう。

ちなみにXMLの解析なんて処理は誰もが行うことなんで、当然にperl(jawptoolの記述プログラム言語)のライブラリにもそのようなものはある。あるものは利用するというのがこの業界の慣例なんだけど、今回はあえて自力で実装してみた。こういうことを"車輪の再発明"と呼んで、この業界ではタブーとされていることなんだけど、それでもやった。なんでかというと、jawptoolの実行環境を出来るだけシンプルにしたいという目標があるから。ライブラリを使えば簡単にプログラムできるんだけど、jawptoolの利用者(居るのか?)はjawptoolを実行するためにライブラリも用意しないといけない。それはまあ別に問題ではないんだけど、用意しなくても使えるようになっていると楽ではないかなと思うのでそうした。自分が他のソフトを使うときに「あれもこれもインストールするように」というのが苦手というのもありまして。あまり筋のいいことをしていないというのは自覚しているんだけど、まあ趣味で開発しているので好きなようにやってます。はい。

2012年7月10日

ウィキニュースの短信を1本。山田五十鈴さん死去。

jawptoolも少し。XML解析を書き直したところ遅くなってしまったんだけど、ちょこっと手直しして少し高速化。以前より遅いのには違いがないんだけど、それでも少しはマシになっただろう。

2012年7月11日

ウィキニュースの短信を1本。韓国大統領の実兄逮捕。逮捕されたウィキペディアの記事「李相得」に逮捕された情報は加筆されていたけど出典がなかったので今回の情報源を出典として追加。あと査読を1本。

そういえば明日からウィキマニア2012が始まる。ウィキマニアというのはウィキメディアンの国際会議だそうで、毎年世界各国を持ち回りで開催されている。昨年はイスラエルで開催されたので日本から参加するには微妙だったんだけど、今年はワシントンD.C。いや、距離的にはこれも微妙というかイスラエルと大して変わらないんだけど、アメリカ合衆国で開催されるというのは日本人にとってはイスラエルよりはまだ馴染みがあるような気がする。あくまで気がするだけだけど。そんでもヘブライ語よりも英語の方がまだなんとかなりそうな気がしないですか?(私は英語できない人なのでどっちにしろダメなんですけれど(^^))。

馴染みがありそうなところでは、2007年にはなんと台湾でも開催されたそうな。まあこれも中国語は全然分からないので、やっぱりどうしようもないんだけど。いつかウィキマニアにも参加してみたいとは思っているんだけど、言語の壁があるから個人的には難しいよなぁ。将来的には日本で開催されることもあるだろうから、そのときは参加したい。というか、日本でやるなら運営を手伝えるといいなぁと思う。

jawptool。MediaWikiで内部リンクするとき、連続するスペースはスペース1個と置換されるという機能があることを知った。先頭と末尾のスペースは無視されるというのは知ってたんだけど。つまり、[[ 夢 (曖昧さ回避) ]]も[[夢 (曖昧さ回避) ]]も[[ 夢 (曖昧さ回避) ]]も[[夢 (曖昧さ回避)]]も全部[[夢 (曖昧さ回避)]]へのリンクとして処理される。正直、こんな機能誰得って気もするんだけど、MediaWikiがそういう仕様ならjawptoolも対応せねばなるまい。ということで対応。

2012年7月12日

ウィキニュースの短信を4本。九州豪雨で死者4人行方不明者14人、冥王星に5番目の衛星発見、スペイン付加価値税増税、ヤマダ電機がベスト電器を子会社化。

jawptool。Personという機能で、人物記事一覧への加筆候補を検出している。具体的には年記事や月日記事に、その年や月日に誕生・死去した人や、都道府県出身の人物一覧記事への加筆候補。それぞれ対応するカテゴリの付与されている人物記事を検出しているんだけど、これがものすごく大量に検出される。こんなにたくさん出ても加筆対応出来そうにないし、そもそも加筆して構わないのかどうかも分からない。軽くノートを見てみたところ「著名な人物のみを掲載すること」とか書いてあって「はあ?」とか思ってしまったり。ウィキペディアに記事があるということは一定の著名性があるということだし、その中で著名であると無いを決めるというのは中立性の方針に反するのではないだろうかと思うんだが。まあこのノートの話し合いが2005年とかかなり昔のことなので、今ほど方針が厳密に守られていなかったという可能性もあるんだけど。かといってノートに乗り込んでいって基準を変えるのもちょっと大変そうなのでパス(^^)。で、結局jawptoolの方を変更することにした。具体的には月日記事、都道府県出身の人物一覧記事への加筆候補の検出はやめる。年記事については1900年以前のみを対象にする。これでかなり現実的な検出数に収まるので、加筆対応も可能ではないかと思う。いつ加筆するんだ、って話は相変わらずあるんだけど(^^)。

更にjawptoolを修正しているんだけど、ソースを眺めていると色々と手をいれたくなってしまって、なかなか当初の予定していたToDoがはかどらない。いかんね(^^)。まあ趣味でやってるんで、楽しんでやってればそれでいいんだけど。んでも、とっとと終わらせて他にやりたいこともあるからなぁ。なんとか進めていこう。

2012年7月13日

ひさびさのウィキブレイク。

2012年7月14日

ウィキニュースの短信を1本。シリアで150人超虐殺。

2012年7月15日

ウィキニュースの短信を2本。アラブの春端緒人物の母親逮捕、プジョーのリストラ策にオランド大統領介入へ。

2012年7月16日

ウィキニュースの短信を1本。平成24年7月九州北部豪雨と命名。死者26人行方不明6人に。

2012年7月17日

ウィキニュースの短信を2本。ロンドン五輪選手村オープン、反原発集会に17万人。

jawptoolを少し。統計機能に出典に関する統計も出力するように機能追加。とりあえず出典の数とバイト数を集計し、記事当たりも出力するようにしてみた。データベースダンプごとの推移をみると面白いんではないかな。

2012年7月18日

ウィキニュースの短信を1本。アメリカの干ばつ1956年以来の規模。

ウィキニュースで分からないことがあったので「ウィキニュース:赤提灯」で質問をしてみた。赤提灯というのはウィキペディアで言うところの井戸端のようなところで、要するに雑多な議論を行うところという位置づけかな。雑多といっても雑談をするところという意味ではなく、きちんとした議論場所が決まっていない話題とか、多くの人の意見を聞きたい場合に使うという意味(だと思う)。

で、何を質問したかというと、IPユーザさんの査読編集について。ウィキニュースの記事は短信を除いて執筆者以外による査読を行うことになっていて、査読してOKなら公開されるという手はずになっている。なんだけど、「ウィキニュース:査読」によると査読自体は執筆者でなければ誰でも行っていいんだけど、公開するのはログインユーザに限られている。つまりIPユーザは公開にすることが出来ない。また、このIPユーザさんは自身が執筆した記事も公開しているので、その点も問題。

という問題があると思うので、公開とした編集を差し戻しするのがいいのかなぁという気がするんだけど、ウィキニュースではこういった管理活動に関わったことがないので、差し戻していいのかいまいち自信がもてない。ということで赤提灯で相談してみることにした。

jawptoolを少し。リダイレクト記事のチェック機能で、リダイレクト先の記事でリダイレクト記事名の言及が無いものをリストアップする機能を追加した。要するに、リダイレクトされるのにその単語についての説明がないというものなので、読者を混乱させる可能性があるということ。実際にチェックしてみると結構見つかるね。全部が全部問題があるというわけではないけれど、精査して問題があるものについては対処していってみようか。ああ、またToDoが(^^)。

更にjawptool。IndexListという機能があって、索引記事のサイズランキングを出力していたんだけど、これを拡張して索引記事の色々な統計を取るようにしてみた。ということでまずは機能名称をIndexStatisticに修正。そんでもって分野名の使用ランキングと節サイズのランキングをとりあえず集計するようにしてみた。

更に追加で孤立したページと短いページの一覧を出力する機能も作成。それぞれMediaWikiにも抽出機能はあるんだけど、検出の基準がいまいち使い勝手がよくないのでjawptoolで実装してみた。ほんとはMediaWikiにパッチを投げられるといいんだけど、それには英語の壁が(^^)。

2012年7月19日

ウィキニュースの短信を4本。リビア議会選挙でリベラル派勝利、シリア爆弾テロで政府高官死亡、元ナチス高官拘束、タンザニアでフェリー沈没。

jawptoolやったよ

2012年7月20日

ウィキニュース。一昨日質問したIPユーザさんの査読の件は、やはり差し戻してよかった模様。ベテラン編集者さんが差し戻してくださったけど、次回からは私もやってみよう(そんなことは無い方がいいんだけど)。あと査読を1件。短信はニュースサイトを見て回ったんだけど、なんかどれもいまいちに思えて今日はお休みに。

ウィキペディアのデータベースが更新されたのでダウンロード。バッチを実行したいところだけど、タイミングが微妙だな。jawptoolは予定していた機能実装が大体終わったから、そろそろリリースしたいところなんだけど。リリースしてからバッチを実行するか、リリース前にバッチを実行するか。はてさて。

2012年7月21日

ウィキブレイク。

2012年7月22日

二日続けてウィキブレイク。ま、そういうこともあるわな。

2012年7月23日

今日もウィキブレイク。あれ?そういうつもりではなかったのだが。

2012年7月24日

jawptoolの0.30をリリース。今回のリリースは新機能をいくつか搭載したのが目玉。ただ、機能実装を優先したのでコードの品質は多分いまいち。速度も遅いし。ということで、これから使いながら整理していこうとは思うんだけど、とりあえず区切りということでリリース。http://sourceforge.jp/projects/jawptool/でダウンロードできますので、興味のある方は是非使ってみてやってください。

2012年7月25日

久しぶりにウィキニュースの短信。トヨタ生産台数2億台、消えた年金の6割解明。査読も1本。

2012年7月26日

ウィキニュースの短信を3本。ガーナのジョン・アッタ・ミルズ大統領急死、パラスケビ・パパフリストゥ選手五輪選手団から追放、アルセーヌ・ルパン70年ぶり新作日本語訳。

2012年7月27日

ウィキニュースの短信を1本。マイナンバー法案三党合意へ。

2012年7月28日

うぃきぶれいくぅ。

2012年7月29日

ウィキニュースの短信を2本。緑の党 Greens Japanが結党、ウガンダでエボラ出血熱。査読を1件して、問題なかったので公開。

2012年7月30日

ウィキニュースの短信を1本。アレフに昨年205人が入信。

今日は7月30日です。1年前の今日、私はウィキペディア日本語版の管理者に立候補しました。って、なんでそんな細かいことを覚えているんだって自分でも少々気持ち悪くなりますが(^^)、まあたまたま覚えていまして。

で、別にこの日を記念してというわけでもないのですが、実は管理者を辞任しようかなぁとここしばらく考えていました。理由は、ごく個人的なことなのでここには記せないのですが。

ちなみにウィキペディア日本語版においては、管理者はいつでも自発的に辞任することが出来ます。理由は必要ありませんし、コミュニティにはかる必要もありません。辞めたいと思ったときにいつでも辞めれます。まあ、管理者もボランティアなので当然と言えば当然なのですが。

でまあ、色々思うところがあって管理者辞任を考えていました。実際、それを考えている間は権限行使をするのは適切でないと思いましたので、ここしばらく管理者業務をお休みもしていました。そうして自分の中で管理者というものがどういうものかを考えていたのですが、結論としては「自分の中で」という発想自体が間違いかなと思うようになりました。以下、私の考えです。他の管理者さんにも同じように考えろということではありません。

「自分の中で」という考えが間違いと書きましたが、そもそも管理者権限というのは私個人の持ち物ではないのですよね。あくまでもコミュニティから預っているもの。持ち主はコミュニティなんです。私という人間は、ただ単にその権限の実行者として信任されているというだけのことです(信任投票では少なくない反対票も頂きましたが……)。なので、その預っている権限を自分の勝手で放棄するのは適切ではないのではないかと思い直したわけです。もちろん先ほども書きましたとおり、管理者もボランティアですので自発的な辞任は完全に認められています。なので自分勝手に辞任することに問題はありません。あくまでも「私が」そうするのは間違っているかなと「私は」思うだけのことです。

そもそも私はウィキペディア日本語版の発展のために微力でも貢献したいと考えて参加しているわけです。もちろん百科事典の編纂プロジェクトですから記事を書くことが一番の貢献であることには間違いではないでしょう。しかし、現時点では私の執筆能力は決して高くなく、記事を書くことでの貢献は出来そうにありません。しかし、ウィキペディアは多様な参加姿勢が容認されています。「Wikipedia:編集方針#多様な参加姿勢が受け入れられます」と方針にもなっています。「雑草とり」だって立派な貢献ですし、管理者業務も貢献になるでしょう。雑草とりは誰でも出来ることですが、管理者業務は管理者にしか出来ません。ただでさえ管理者不足と言われているウィキペディア日本語版において、微力でも管理者業務を行う者が居ることは有益なことではないかと思い直しました。もちろん、方針に従った適切な管理者権限行使が行われていることが前提ですが。

ということで、1年前の立候補のときの気持ちを思い出し、改めて管理者としてウィキペディア日本語版に微力でも貢献していきたいと思います。もちろん、いずれは執筆でも貢献できればと思っています。あと、今は管理者を続けることにしましたが、将来に渡っても続けるかどうかはもちろん分かりません。やっぱり気が変わるかもしれません。そのときは、そのときということでご容赦を。

2012年7月31日

昨日、管理者続行を決心し、さてこれからまた貢献していこうというところでなんですが、この日記の定期的な更新を停止しようと思います。

何でかというと、理由は言うまでもないかなといいますか、この日記の質的な低下にあります。初期の頃はウィキメディアで見ること全てが初めてで、知ったこと経験したことを書き記すことが自分にとって大きな意味を持っていたと思います。しかし、最近は内容的には随分詰まらなくなってきました。理由は単純で、作業内容が単純な繰り返しになってきているんですね。それはウィキメディア・プロジェクトへの参加としては別に問題ないのですが、日記として記すほどの必要性があるかというと個人的にはちょっとどうかと(もちろんそういう日記を書いている他の方を批判しているわけではありません。あくまでも私自身にとってということです)。

あと、タイトルに「新人」となっていますが、アカウントを取って1年以上経過して新人もないだろうというのもありますかね。かといってベテランというわけでもないのですが。ウィキメディア・プロジェクトの全てを知り尽くしたというわけではもちろんありませんが、それでも1年分の経験を積んだことで、それなりに勝手の分かってきたこともあります。なので、新しいことに手を出さない限り、取り立てて書くこともないのではないかなというように思います。逆に言えば、何か書くことがあればまたここに書くこともあるかもしれません。ですのでこの日記は閉鎖ではなく定期更新の停止というわけです。ということで、読んでいて下さった方がどれほどいらっしゃるのかわかりませんが、ひとまずお別れということになります。読んでくださってありがとうございました。そして、しばしのさようなら。(あ、ウィキメディア・プロジェクトの活動は継続しますよ、もちろん)


あおやぎのさいと2.0 新人うぃきめでぃあん日記