新人うぃきめでぃあん日記:2012年1月

2012年1月1日

年が明けましておめでとうございます。ということでウィキブレイクでございます。念のため、酒を飲んではおりませんです。

2012年1月2日

今日も正月でウィキブレイク。

2012年1月3日

3日でようやくウィキ始め。

まずは久しぶりに削除依頼。6件を削除対処。

即時削除も対処。即時削除には、テンプレートの改名の残骸も提出されていたんだけど、テンプレートの改名の残骸は「Wikipedia:即時削除の方針」にはないんだよね。カテゴリーはあるんだけど。ていうかテンプレートだったら移動してればよかったのに。ということでこちらも即時削除タグを剥がして、「Wikipedia:削除依頼」をご案内。

その他には移動の残骸などを6件即時削除。久しぶりだけど、結構いっぱい対処したな。

小学校の曖昧さ回避を一つ立項。これも早く片付けてしまいたいんだよなぁ。目標、年内に片付ける(笑)。というのは冗談として、できるだけ早く終らせて、他の作業に取り掛かりたいところなのは本音。

2012年1月4日

今日は削除依頼には対処できそうな案件はなし。即時削除ではコモンズに移動したファイルを2個削除した。

小学校の曖昧さ回避を4個立項。

2012年1月5日

削除依頼で4件削除、1件存続。即時削除は今日はちょっと多くて8件削除した。いずれも改名提案による移動の残骸。

データベースダンプが更新されていたので、ダウンロードして定例パッチを仕込む。

2012年1月6日

定例バッチは無事終了していたので、レポートを差し替える。改めて宣伝ですが、jawptoolのレポートをウィキペディア日本語版解析ツール(jawptool)別館にて公開しています。よろしければご覧ください。

レポートのうち、長期間経過した削除依頼の一覧であるpassed-sakujo。いつもは1件も含まれていないんだけど、珍しく複数報告されている。報告されている記事を調べてみると、ほとんどは存続で終了となったものなのに、削除依頼タグが剥がされていないというものだった。これは単なる剥がし忘れだから、剥がしても問題ないかな。ただ、1件だけそうではないのがあった。「Wikipedia:削除依頼/沖縄県功労章」というものだけど、どうやら「Wikipedia:削除依頼」に提出されていなかった模様。そうなのよ。こういうのを発見するためにこの機能は作られたんだよね。それが発見できて大変嬉しい。削除依頼タグなんて、長期間貼りっぱなしでいいことなんて何もないからね。とにかく何らかの対処がなされるべきなわけで。ということで、本日付で依頼を提出する。

削除依頼は3件を削除対処。即時削除は今日はちょっとお休み。

今日はおでかけで地元の図書館に行ってきました。ここで「私の履歴書」の書籍版を閲覧。日本経済新聞の古い縮刷版は蔵書してなくても、書籍版は蔵書してた。でも古い本だから開架されてなかったのでいちいち請求しての閲覧だったけど。

書籍版を閲覧して、無事に「五島慶太」と「砂田重政」の分は虫取りが完了。これでウィキソースに公開できる。しかし、困ったことに「大麻唯男」の分は書籍版に掲載されていない。おやぁ?全員の分が必ず載っているわけではないのね。書籍化するにあたって、本人か遺族からの許可がでなかったのかな。うーん、それにしても困ったな。これは日経本社にでも行かなきゃ無理か?どっか他に日本経済新聞の古い縮刷版を蔵書しているところはないかなぁ。

私の履歴書の書籍版では、まだ入力可能ではないのだけれど「室生犀星」の回が載ってたのでちょこっと読んでみた。しかし、芥川龍之介についてはあまり書いてないのね。親しかったようだし、芥川が自殺する直前に室生を訪ねていたけど会えなくて、そのことを室生は後悔していたという話もあったと思うのに。後悔の念があるからこそ、あまり触れたくなかったのかもしれないけど。

その他、何かいい資料はないかなぁと書架を眺めて回る。私は以前、氏族に関する記事をいくつか立項したんだけど、その時参考にした資料にはあまり情報が載ってなくて、記事がスタブになってしまった。なんとか加筆できる資料がないかなと思ったら、なかなかいいのがあった。マイナーな氏族なんでそれでも記述は少なめなんだけど、これを元にすれば少しは加筆できるかな。その本は貸し出し不可だったんで、必要なページのみコピーを取る。

2012年1月7日

今日は削除処理はちょっと気が乗らないのでお休み。そんなことでいいのかという気もするが、削除を含む管理者権限の行使は影響の大きい行為だから、気持ちが乗ってないときは無理してやらないのも、ある意味必要なことだよなとも思う。自分に対しての言い訳かもしれんけど。

気分を変えてネットで図書館探検。国会図書館の他に大きな図書館はないかなぁと思って都立図書館の蔵書を検索してみたら、日本経済新聞の縮刷版をかなり蔵書していることがわかった。おお、素晴らしい。

善は急げ、ではないけれど時間が取れたので早速都立中央図書館にやってきました。広尾にあるんだけど、広尾なんて初めて来たよ。なんか街の雰囲気が高級で、庶民としては落ち着かない感じ(^^)。ま、それはいいとして。

目的の都立中央図書館。国会図書館の様に入館登録が必要なのかなと思ったら、それはないみたい。ただ、入館証を貰って入らないといけない。あと、国会図書館と同様にカバンの類は持ち込めないのでロッカーに入れると。ふむふむ。

そういえば、国会図書館は18歳未満の場合は入館お断りだったんだけど、ここにはそういう掲示はないなぁ。大丈夫なのか。私は18歳以上なので気にする必要はないのですけどね。

無事入館して、日本経済新聞の縮刷版を探してみたら、あったあったよ。ここも開架してある。すばらしー。ということで目的の「大麻唯男」の記事を探して、国会図書館の蔵書では読み取れなかった文字をなんとか判読。ほっ。

ついでと言ってはなんだけど、入力可能な「村松梢風」、「鳩山一郎」、「金森徳次郎」の複写も申請。ここでも司書さんがコピーを取ってくれるので大変ありがたい。

2012年1月8日

削除依頼を2件、即時削除を1件削除対処。

Wikipedia:リダイレクトの削除依頼/2011年10月」で「花王抗議デモ」に対してリダイレクト先を変更する条件で存続票を入れたんだけど、存続という結果になったのでリダイレクト先を変更。

あともう1件。「リダイレクトの削除依頼 2011年9月」で「UFO (僕らの銀河系)」について改名が必要とコメントしたんだけど、こちらも存続になったので改名を提案。現状、曖昧さ回避のような記事名になっているけれど、カッコ内を含めて正式タイトルだから曖昧さ回避ではないんだよね。「Wikipedia:記事名の付け方」に明確に違反している場合は提案は不要で即時改名が可能なんだけど、括弧を全角と半角のどちらを使うかについて決まっていないので、念のために提案することにした。

2012年1月9日

削除依頼を5件対処。即時削除は今日は対処できそうなのは無し。

2012年1月10日

削除依頼は1件存続で終了。リダイレクト記事で、同じ案件がリダイレクトの削除依頼にも提出されたから。即時削除は3件削除対処。

Wikipedia:出典をつけよう大会」というのが間もなく開催される。現状、ウィキペディア日本語版の記事には出典の無いものが多い。大原則として全ての記事には出典が必要なのだけど、それが全ての執筆者に理解されているわけではないため、出典の無いままになっているものが多数ある。という私も参加し始めた当初は出典の無い記事を作成したり加筆したりしたことはあるから、全然偉そうに言えたことではないんだけれど。

でまあ、その出典の無い状態を改善するため、みんなで出典をつけましょうというイベントが開催されるわけだ。イベント自体は「Wikipedia:執筆コンテスト」に似た感じで、基本的にはオンラインで開催される。参加するには、大会ページで参加表明すると、出典を付けた編集についてポイントが計算され、多くのポイントを得た人が表彰されるという具合らしい。参加表明するのはどうしようかと思うけど、、出典付け自体は自分も出来るだけこの期間に作業できればなと思ってる。思ってるだけじゃダメだけど。

あと、出典付け大会の関連イベントとしてオフ会も開催される。オフ会と言っても単に顔を合わせるだけじゃなくて、みんなで集まって出典を付けるというオフ会だけど。いかにもウィキペディアらしいオフ会だなぁ。これが当初は京都で開催されるということで、ちょっと遠くて参加できないなぁと思っていたんだけど、東京でも主催してくださる方が現れた。これは嬉しい。参加できるかどうか日程を調整してみないとわからないけれど、出来ればこれは参加したいな。

それとは別に、今日は久しぶりにjawptoolを少しいじっていた。コードカバレッジという概念がある。要するに実際のコードのどれくらいの範囲に対してテストコードが書かれているかということ。もちろん100%が望ましい。で、このコードカバレッジを調べてくれるツールというのもあるので、jawptoolで調べてみた。結構頑張ってテストを書いたつもりなので、いい成績になるかなと思っていたんだけど、あまりよくなかった。がーん(笑)。いや、笑い事じゃないんだけど。うーん、テストを書くのって難しいなぁ。

ということでコードカバレッジが100%になるように、テスト漏れのケースに対してテストコードを書いていたんだけど、これがかなりの作業量。ちょっとこれは大変ということで、中断。今日明日にいきなり100%に持っていくというのは無理そうだ。腰をすえて、じっくり取り掛からないといかんね。ということでjawptoolはやっぱりしばらくお休みにして、他の作業を先に片付けてしまおう。

2012年1月11日

削除依頼を5件削除対処。即時削除は今日はいっぱいある。10件削除対処。2件は即時削除方針に合致しないのでタグを剥がして対処。

久しぶりの小学校の曖昧さ回避。今日は6個作成。そろそろ小学校の部の終わりが見えてきたかな。それでもまだ30個くらい残っているんだけど。しかし中学校は200くらいあって、それもとなるとなかなか終わらないなぁ。その先には更に高校もあるんだけど、こちらはそれほど多くないので、小学校の次は高校に手をつけようかしらん。

ウィキソースの「私の履歴書」の入力作業。「金森徳次郎」の作業に着手。しかし全部で17回もの連載なので、一日では終わらない?。

2012年1月12日

削除依頼は今日は処理できる案件が残っていなかった。即時削除は6件削除対処。コモンズに移動されたファイルが今日は多かったなぁ。

あとは「私の履歴書」の入力作業。しかし、こうして他人の履歴書を読んでいると、自分も書きたくなってくるな。私に対して執筆依頼がされることはありえないだろうけれど、それでも市井の一人の記録として残す価値はあると思うから、いつかは書きたいと思うんだけどねぇ。

2012年1月13日

今日はウィキブレイク。忙しいのよん。

2012年1月14日

削除依頼を2件削除対応。即時削除にはいくつか案件が出ているんだけど、いずれもちょっと対処が難しい。ので他の管理者さんにお任せすることにする。

小学校の曖昧さ回避。今日は少し頑張って10個作成。小学校はあと15個くらいかな。ようやく終わりが見えてきた感じ。

私の履歴書」入力作業。ようやく「金森徳次郎」終了。ぜいぜい。まだ見直しがあるからアップロードしないけど。

それにしても金森徳次郎氏。入力しててなかなか楽しかった。これまでの人が楽しくなかったわけではないんだけど、金森氏は特に楽しかったかな。読書家らしく、文章も上手だし。なかでも第16回の国立国会図書館に関する節は「真理がわれらを自由にする」の標語も含めて、なかなかに読み応えがあった。その思想的にはウィキメディアに通じるところもあると思うので、読んでて気持がちょっと熱くなってきたり。金森氏の功績を思いながら、これからも国会図書館を利用させていただくことにしよう。

2012年1月15日

削除依頼は今日はたくさん処理した。8件削除、1件存続。即時削除は3件削除。

改名提案していた「UFO (僕らの銀河系)」について、反対意見がなかったので移動を実施。と思ったらうっかりしてた。一週間(168時間)経過したと思ったけど、あと3時間ほど足りなかった!うかつ!!仕方がないので、移動はそのままにして残り3時間を追認期間とするようにノートに記載。あーいかんなぁ。ボケてる。

小学校の曖昧さ回避の立項。あと少しで終了できるということで頑張った。今日だけで13個立項。最後の「明和小学校」を立項して、リストアップしていたものは全て終了。はあ、ここまで長かった。しかしこれで全て終わりというわけではなくて、まだ中学校編が待っているし、小学校にしてもデータベースダンプが更新されたら、新たな立項候補が出るかもしれない。だからこれもライフワーク的な作業になってしまうなぁ。ああライフワークがどんどん増える。いくら生きても時間が足りないよぉ(^^)。

ウィキソースの入力作業をしていて思うんだけど、作業の競合ってどうするんだろうね。私が今入力しているテキストを、他の人も同時に入力しいてたらどうなるんだろう。実際のところは、先にアップロードした者勝ちになってしまうだろうと思う。まあ勝ち負けのある話ではないんだけど。でも、後になってしまった人は自分の作業が無駄になった感を覚えるだろうね。多分。そうならないように作業予約とか出来る仕組みがあるといいと思うんだけど、どうなんだろう。「青空文庫」ではそういう仕組みがあるみたいなんだけど。ウィキソースの場合は、ウィキなんだから入力した端からどんどんアップしていけばいいという考え方でいいのかな。それはそれで版数がやたらと増えそうで、ちょっといやな感じもするんだけど。そのうち機会があれば、ウィキソースの井戸端とかで聞いてみよう。

ウィキペディアを閲覧してて「訃報 2005年」という記事を見つける。おお、年記事から訃報が分割されてる。一体いつから?どこのノートで話し合われたんだろう。ともあれ、これはjawptoolのperson機能の修正が必要になるな。今度よく調べてみよう。

Wikipedia:出典をつけよう大会」が正式に開始された。今日から3月31日までの長いイベント。これで少しでも多くの記事や記述に出典が付くといいなぁ。そして、私もそれに少しでも貢献できればいいなぁ。

あと偶然なのかどうかわからないけれど、今日は「Wikipedia:ウィキペディアの日」らしい。そうだったのか。ともあれめでたい。

2012年1月16日

削除依頼は6件削除。即時削除を1件削除。

学校の曖昧さ回避記事の作成。小学校が終わったので次は中学校の番だけど、中学校は数が多いのでちょっと後回しにして高校に着手。といっても高校は全体数が少ないだけあって同名校もそれほどない。あっという間に終わる。

ということで、いよいよ中学校編に入る。予定数は150個くらいあるんだよなぁ。大体小学校と同じくらいあるかな。果たしていつになったら終わることか。とりあえず今日は10個作成。このペースだと15日ということで、今月中に終わるということなんだけど、そんなにうまくはいかないよなぁ、多分。

私の履歴書」入力。「村松梢風」。なんとか完了。更に「鳩山一郎」に取り掛かるが、これは流石に終りきらない。

2012年1月17日

削除依頼は今日は対処できる案件がなかった。正確には1件あったんだけどね。とあるブログからのコピペで著作権侵害のおそれという依頼で削除の合意は出来ているんだけど、肝心のブログがサービスのメンテナンス中でコピペを確認出来なかった。インターネット上のリソースの場合、こういうケースもあるわけだねぇ。確認出来ないものは仕方ないので対処はしない。明日残っていたら対処しよう。即時削除は5件削除対処。

中学校の曖昧さ回避立項。今日はちょっと頑張って16個作成。少々疲れた。中学校は小学校よりも数が少ないから同名になる学校数も少なくて、項目数が少なくなるみたいだね。だから小学校よりも作業が楽かも。

地元の図書館にお出かけ。いくつか資料の取り寄せを依頼する。その他に何か使えそうな資料はないかなと館内を少し探してみると、結構いろいろ見つかるね。面白い。

ここの図書館はそれほど規模は大きくない。基本的にワンフロアしかないし、フロアもそんなに広くない。そこの開架スペースとなるとほんとに大した量ではないんだけど、逆にこれくらいの量だと見通しが利いてそれはそれで便利かもしれない。国会図書館は膨大な蔵書を抱えているけど、基本的に全て閉架されているので、どんな資料があるのか知ってないと利用することが出来ない。もちろん端末から検索することは出来るけど、本を探すのってそういう方法だけじゃないじゃない。amazonで全てことが足りるかと言うと、やっぱり書店で棚を眺めながら、偶然の出会いを求めることだってあるわけだし。

今の私はどんな資料があるのかよくわからない状態だから、開架されているのを眺めていって、こんな資料があるのかというのが分かるほうが便利。今回見つけた中では「スポーツ人名事典(ISBN:978-4816917011)」なんてのがあったんだけど、これなんて出典の付け放題ではないだろうか。残念ながら禁帯出なので、借り出すことが出来ないんだけど。

ほかに「寺院神社大事典」なんてのも見つけた。こりゃ凄い。これも出典の付け放題かも。ただ、この本は1冊で全国を網羅してなくて、分冊になっている。ここに蔵書してたのは近畿地方の「大和・紀伊寺院神社大事典」「京都・山城寺院神社大事典」「近江・若狭・越前 寺院神社大事典」の3冊のみだった。他の地方のもあるといいんだけど。

2012年1月18日

削除処理は今日はお休み。

見直しが終わったので、「私の履歴書」をウィキソースに三人分まとめてアップロード。今年の分の作業は終わったー。でも来年の仕込みも始めなきゃね。2013年に公開可能なのは8人分というボリュームだから、早くから手を付けていかないと。とはいえ、今年の分が終わったばかりなので、とりあえずは私の履歴書はしばらくは手をつけないけど。他にもやることあるしー。

2012年1月19日

削除依頼を2件削除処理。即時削除を5件削除処理。

中学校の曖昧さ回避の作成。今日は頑張って28個作成。いや、どうせならあと2個作って30個にしろよと自分でも思わなくも無いが、流石にこれだけ作ると疲れたので終了。それにしても、やっぱり小学校より中学校の方が楽だね。

この間図書館で見かけた「寺院神社大事典」。他の地方のがあるかなと思ってぐぐってみたところ、例の3冊しか出版されてなかったというオチが。がーん。まあ、この手の本って儲かるわけじゃないだろうし、なかなかうまくはいかないのかもねぇ。せっかくいい出典になると思ったんだが、惜しかった。

2012年1月20日

削除依頼を2件削除処理。他にも対処可能な案件はあったんだけど、今日は時間がなかったのでパス。

2012年1月21日

削除依頼を4件削除処理。即時削除は記事を2件と、画像を15件!画像は全部コモンズへ移動したもの。これだけまとめてやると、さすがに疲れる。でも全部処理できてちょっと気持いい。

中学校の曖昧さ回避を20個作成。うち2個は、既に存在したリダイレクト記事を曖昧さ回避化したものだけど。

今日作成したものの中に「吉田中学校」がある。「吉田小学校」のとき、26個もあって作成が大変だったものの中学校版。今回もやっぱり数が多くて13校もあった。なんで全国にこんなに吉田とつく学校が多いのかな。まさか「吉田学校」の影響というわけではあるまいに。

普段は起床後、朝食までの時間をウィキメディアの作業時間に当てているんだけど、今日は夜にも時間が取れたので作業。やることは相変わらず中学校の曖昧さ回避。朝に続いて夜にも20個作成。今日だけで40個か。だいぶ進んだな。

色々実験してみるために、手元にMediaWikiの環境を用意してみようと思う。ということで、まずはVMwareにFreeBSDをインストールするところから。FreeBSDは先日9.0がリリースされたので、せっかくなのでそちらを使ってみる。インストーラが刷新されたということだったけど、ほんとに変ってるよ。当り前だけど。10年以上慣れ親しんできたsysinstallからさよならしてbsdinstallというのに変った。慣れなくてちょっと手間取ったけど、なんとかインストール完了。続きはまた今度。

ちなみにMediaWikiというのは、ウィキペディアをはじめとするウィキメディア財団のプロジェクトサイトを構築しているCMSのこと。CMSというのはコンテンツ・マネジメント・システムと言って、まあ要するにwikiなどのサイトを構築できるツールのこと。

ついでに簡単に説明すると、FreeBSDというのはオープンソースのUNIX。一般にはLinuxの方が知られていると思うけど、その仲間と思ってまあ間違いない。私はなんとなく好みでLinuxではなくFreeBSDを使うことの方が多い。といっても、それほど強いこだわりがあるわけではないんだけどね。

MediaWikiでちょっと試してみたいことがあるとしても、ウィキメディアのサイトをテスト的な用途に使うのは問題がある。wiki文法のチェックだけなら「Wikipedia:サンドボックス」を使うという方法もあるけれど、もうちょっと込み入ったことを試したいとなると、やっぱり手元に自由に出来る環境がある方が何かと都合がいい。ということで、MediaWikiをインストールしてみているというわけ。

2012年1月22日

削除依頼を4件削除処理。しかし複数記事がまとめて依頼提出されている案件があったので、実際に削除したのは11件。これだけ削除すると結構大変。ということで即時削除は今日はパス。

中学校の曖昧さ回避を15個作成。ぜいぜい。でも残りがだいぶ少なくなってきた。あと少しだ。

2012年1月23日

削除依頼を2件削除処理。即時削除を10件削除処理。ぜいぜい。

データベースダンプが更新されたのでダウンロード。しかしダンプもだんだん大きくなるから、ダウンロードも時間が掛かるようになってきたような気がする。まあ大きくなるのはそれだけウィキペディア日本語版が成長しているということだから喜ばしいことなんだけど。

ダウンロードがようやく完了したので定例バッチの実行。半日かかって完了したのでレポートの差し替え。

MediaWikiの環境構築。準備でVMware上にFreeBSDのインストールは終わった。次にapacheとかphpとかmysqlとかをインストールしていく。が、packageからphpを入れるとapacheのモジュールにならないのね。がーん。仕方がないのでphpだけportsからインストール。php5-extensionsというのも必要なんだけど、こちらもportsからインストールしないとmysqlバインディングがインストールされない。ここら辺が、FreeBSDでの注意点なのかなぁ。ぐぐってみると、同じところで引っかかっている人が何人もいる模様。

ちなみにpackageというのは、FreeBSD用にコンパイル済みのプログラムファイルの一式。ここからインストールするならコンパイル不要なのでらくちんにインストールできる。portsというのはソースコードからコンパイルしてインストールする方法。いちいちコンパイルするのは面倒なようだけど、コンパイル時にしか設定できないオプションとかがあるから、こういうのも必要なわけです。実際、今回はまったphpについてもpackageでは設定されてないオプションを有効にしたかったからportsからインストールしたわけで。

というところまでで今日のところはおしまい。続きはまた明日かな。「MediaWiki」でとりあえずインストール方法とかのドキュメントを眺めてみるけど、情報が古いままで放置されているものも多いみたいだね。こういうのの和訳とかも手がけられるといいなぁ。ああ、またToDoが(笑)。

2012年1月24日

ここんところ削除依頼案件が積みあがり気味のような気がしたので、少し気合を入れて対処。と言っても9件だけど。私にしては多いな。内2件が版指定削除。これは他の管理者さんの確認待ちになるんだけど、ミスがないといいなぁ。

即時削除はテスト投稿を1件、コモンズに移動した画像を8件削除。

削除依頼で1件、対処のしようがないなぁと思っていた案件があった。外部サイトからの転載ということで、議論は削除で合意しているんだけど、確認してみると外部サイトから転載された記述が消去されている。これではいくら合意があっても、転載の事実が確認できないから削除できない。それにしても、なんで削除されたんだろうね。ウィキペディアから削除されないため?だったら立項者はそのサイトの管理者ということかしらん。だったら「Wikipedia:自著作物の持ち込み」をしてくれれば、救済できる可能性もあるんだけど。

ともあれ、対処のしようがないのでそのままにしていたら、他の管理者さんが別のサイトで問題の記述を確認したということで削除対処されていた。おお、なるほど。そういう手があったか。抜けてますな>私。とりあえず、ぐぐってみるというのは大切ですね。

中学校の曖昧さ回避の作成。あと少しだということで気合を入れて全部作業。今日は29個作成し、「浅間中学校」をもって作業完了。はあ、ここまで長かった。

しかし、これでもう終わりかというとそういうわけではない。学校記事が作成されれば、曖昧さ回避の候補も追加で出て来る可能性がある。それはデータベースダンプが更新されるたびに検出可能なんだけど、そのたびに作成だと大変なので、これからは年に1回とかまとめて作業をするようにしようと思う。ほかにも、こういうデータベース更新による編集作業は、同じように年に1回にするといいかも。それにしても、学校の曖昧さ回避の作成がようやく終ったので、これからは他の作業に移れる。個人的に非常に気分がよい。よかよか。

準備を続けていたMediaWikiの環境構築作業。いよいよMediaWiki本体のインストール。手順は「インストールガイド」に書いてある通り。と言っても単純なもので、配布パッケージを展開してconfig/index.phpにブラウザからアクセスすると、あとは質問に答えていくとインストールが完了するようになっている。インストーラは日本語にも対応しているの大変簡単。あっという間に、My-wikiが作成できた。こんなに簡単に出来るとは、ちょっと感動。

それにしてもMy-wiki。当り前だけど自分は自動的に管理者。何でも出来る。保護でもブロックでも削除でもやりたい放題。ま、そんなことをしててもすぐ飽きるんだけど、最初は嬉しくってやってしまうよねー。それにしても、まるでウィキペディアみたいなサイトを自分で持てるんだから、なんか気持いいよね。これを自分が所有しているということで、全能感に浸れるというと言い過ぎか。

しかし、いくら自由に出来ると言っても何も中身がないとそれは寂しいもの。ということで、ウィキペディアのダンプデータをインポートしてみる。やり方は「Wikipedia:データベースダウンロード」に書いてある通り、コマンドライン上で

$ bunzip2 -c pages-articles.xml.bz2 | php maintenance/importDump.php

とやればインポートできる。これが面白い。当り前だけど、My-wikiにウィキペディアのデータがどんどん追加されていく。うひゃひゃひゃひゃひゃ。ただ、噂には聞いていたけどインポートには相当時間が掛かる模様。しばらく待っていたけど1000記事くらいまで行ったところで中断。こりゃ80万記事をインポートするのを待ってはられない。今回はそれが主目的じゃないからね。今回の目的は、MediaWikiのテスト環境と開発環境を構築することだから。

ところで、MediaWikiってどれくらいカスタマイズ出来るんだろうね。とりあえずインストールしてみたところではウィキペディアにそっくりな外観になったけど、MediaWikiを使っていても外観が全く違うサイトはいくつもあるよね。ウィキリークスとかも全然wikiっぽくないし。ああいうのはどうするんだろ。まあ、おいおい調べていってみよう。

あと、今回インストールして知ったのは、データベースとしてMySQL以外も使えるということ。てっきりMySQLオンリーかと思ったら、そんなことは無いのね。PostgreSQLとかも普通に使えるようだし、何よりSQLiteが使えるというのは個人的には発見かな。ウィキペディアのような巨大なサイトを運営するならMySQLのような本格的なRDBMSが必要だけど(MySQLが本格的なRDBMSかどうかは意見が分かれるかもしれないが......)、個人的なサイトを運営するならSQLiteでお手軽に構築できるとありがたいという用途もあるだろうからね。

色々単語を並べたので簡単に説明を追加。MySQLとかSQLiteというのはRDBMSの一種。RDBMSというのはリレーショナルデータベースといってデータベースの一種。リレーショナルとは何かというと説明が難しいのでパスするけど、ある程度大きなデータを取扱うデータベースシステムはRDBMSであることが多いと思っておけば、大体あってると思う。

MySQLとPostgreSQLはオープンソースの代表的なRDBMS。どちらもクライアント・サーバ型でかなり大規模なデータを取扱えるし、クラスタと言って複数のサーバを組み合わせて動作させるような用途にも対応している。

一方、SQLiteというのはRDBMSではあるんだけどクライアント・サーバ型ではなくライブラリ型。クラスタにはもちろん対応しないし、あまり大規模なデータを取扱うのには向いてない。ただ、クライアント・サーバ型ではサーバの設定とかが必要になって、運用にかなりの手間が掛かるんだけど、SQLiteではそういった手間はほとんど掛からない。お手軽に使えるので、小規模な用途であればSQLiteを使うのも一つの方法です。

2012年1月25日

今日はちょっと寝坊してしまったので、削除処理などはお休み。まあそういう日もあるでしょう。

学校の曖昧さ回避記事の作成が完了したので、次の作業として「Wikipedia:索引」のメンテナンス作業。具体的には、「Wikipedia:赤リンク」の除去と「【曖昧】」を「【曖昧さ回避】」に修正する作業。前者については「Wikipedia‐ノート:索引#赤リンクについて」で了解が得られているので作業に取り掛かるのには問題ない。後者については「Wikipedia‐ノート:索引/過去ログ2008-11-24#曖昧さ回避ページの分類について」で合意があると思っていたんだけど、今改めて読み返してみると合意というには微妙かな。改めて提案しなおしてルール化した方がいいかも。ということで「【曖昧】」を「【曖昧さ回避】」にするのはちょっと保留にするか。

ちなみに、現時点で「【曖昧】」と「【曖昧さ回避】」が「Wikipedia:索引」で、それぞれどれくらい使われているのか、データベースダンプから調べてみたところ、「【曖昧】」が15830件、「【曖昧さ回避】」が16841件と、わりと拮抗してる。圧倒的に「【曖昧さ回避】」が多いと思っていたのになぁ。これはどっちかに合わせるにしても、作業が膨大になるな。場合によっては「統一しない」という選択もあるかもしれない。

2012年1月26日

削除依頼。4件を削除対処。更に4件を版指定削除対処。計8件は疲れる。版指定削除は作業が複雑だから、更に疲れる。ということで即時削除はお休み。結構たくさん出てるんだけどね。時々、削除依頼に「即時削除タグを貼ったが数日経っても対処されないのでこちらにもって来ました」という案件があって、対処できてなくて申し訳ないとは思うけど、一方で案件が大量にあったりするとなかなか対処しきれないという事情もあるんですよ。いい訳ですが。管理者や削除者が増えて人手が増えると解消すると思うんですけどねぇ。

即時削除はお休みと思ったけど、4件ほど対処。少しでも助けになればと。まだ画像とか大量に案件が残っているんだけどねぇ。

以前も書いたけど、普段は朝の時間だけをウィキメディアにあてているけど、今日は昼間も時間が取れた。ので、削除依頼の積み残し案件の対処を頑張ってみた。なんと14件対処。流石に疲れたよ。内5件が版指定削除。これで、対処できそうなものは大体片付いたと思う。

あと、最近はあまり手を出していないんだけど、移動依頼で見かけた案件があったので依頼を終了させておいた。改名提案が反対があってお流れになったんだけど、依頼者が移動依頼に出したことを忘れていた模様なので、代わりに終了させておく。ついでに、他にも2件終了とした。

2012年1月27日

今日も時間が取れるので、一日ウィキペディアデー。まずは削除依頼を4件削除対処。

次に即時削除を9件削除対処。1件はタグ除去。統合によって生じた括弧付きのりダイレクトが出ていたんだけど、これは削除できない。というか削除してはいけない。改名によって生じたリダイレクトは削除していいんだけどね。なんでかっていうと履歴保持のため。改名の場合は履歴も全部持っていけるから、残骸のリダイレクトを削除しても問題ない。しかし統合の場合は履歴は元の記事に残っているから、これを削除してしまうとGFDL違反になってしまう。具体的には、統合前の執筆者の成果を、統合後の執筆者が盗んだことになってしまう。だからダメなの。

あとコモンズに移動した画像を6件即時削除。これで対処できそうなものは片付いたかな。ぜいぜい。

久々に会話ページにコメントが。何事かと思ったら、先ほど即時削除した記事について、異議申し立てが。投稿者本人依頼によるものとして「CSD#全般8」を適用して削除したんだけど、投稿者によると即時削除を依頼した覚えは無いとのこと。えー、と思って改めて削除版を確認したところ、確かに即時削除依頼タグは貼られていない。ぐっはー。完全なミスだよ。しかしおかしいなぁ。タグが貼られてないなら、なんで「Category:即時削除対象のページ」にカテゴライズされていたんだろう?不思議だけど、今となってはその理由を調べる方法もないなぁ。ともあれ、投稿者さんには謝罪。十分注意していたつもりだけど、これからも更に注意して作業するようにしよう。

学校の曖昧さ回避の作成が終わったので、次のjawptoolによる編集として索引の赤リンク除去作業に取り掛かる。しかし、始めてみて分かったけど、これ凄い大変。赤リンクはjawptoolで検出できているんだけど、その一つ一つについてどういう理由で赤リンクになっているか確認しないといけない。削除されているなら索引からも除去でいいけど、改名されている場合は改名先にリンクを修正するべきだし。

あと驚いたのは立項せずに索引に赤リンクだけ追加されているケースがあること。これも宣伝を狙っているのかなぁ。どういう意図か、記事の痕跡すらないからわからないんだけど、まあこういうのは削除してもいいでしょう。でも中にはリダイレクトを作成することで赤リンクから救済できる場合もあるから、そういうときはリダイレクトを作成したりとか。そうすると、当然そのリダイレクトが作成に値するかどうかも検討しなきゃいけないから、更に手間が掛かる。うーん、こんなに手間が掛かるなら機械的に除去だけを行ってもいいのかなぁ。追加したい人は後から追加すればいいわけだし。と、ちょっと作業方針に悩む。ともあれ、これもレポートの量が半端ないので、終わるまでに一体いつまでかかるのやらだけど。

2012年1月28日

削除依頼を4件削除対処。即時削除は6件削除対処。

2012年1月29日

削除依頼を1件削除対処。即時削除を2件削除対処。

Wikipedia:管理者伝言板/投稿ブロック」に報告があったIPユーザを一週間ブロック。ブロックは久しぶりだな。大抵は既に他の管理者さんが対処済みなんで私は出遅れているんだけど、今日はたまたまタイミングが合ったのか、報告後どなたも対処されてないようだったのでブロックした。ブロック理由は、過度の連続編集とその注意を聞かない対話拒否。ブロック後、会話ページと管理者伝言板にブロックの報告を書いて対処完了。これで理解して問題行動が収まってくれるといいんだけどなぁ。

2012年1月30日

今日は案件が多い。削除依頼を11件削除対処。

以前から気になっていた「ホノルルマラソン」の出典付け作業。なんでホノルルマラソンが気になっているかというと、自分が走ったことがあるから(^^)。ただそれだけ。ま、記事に手を入れる興味なんてそんなもんでしょう。全く門外漢のことは、雑草取りでもなければ手も出せないし。

今日のところは「参加者数」の節に2011年の結果を追記したのと、その出典を付けたのと。出典は、ウェブでは古いものは見つからないんだよなぁ。公式サイトで掲載していてくれてもいいのに。図書館で借りてきたホノルルマラソンの本には一部データが載っていたんだけど、明らかに誤植があったので採用しないことにした。うがぁー。

jawptoolはSourceForge.JPで公開しているんだけど、SourceForge.JPではユーザがプロジェクトに評価をつけることが出来る。jawptoolはまだまだ無名なツールなので評価なんてこれまでされたこともなかったんだけど、ふと気が付いてみたら1件だけ付いてた。びっくり。

で、その評価だけど5段階の3。コメント無し。匿名。うーん。

評価してくれたことはありがたいけど、どう受け取っていいか困るな。何が良かったのか、何が足りなかったのか。まあ、それをストレートに書かれても、こっちがダメージを受けたかもしれないので、これでいいのかもしれないけど。

2012年1月31日

1月も今日でおしまいですな。今月は削除処理はそれなりに出来たけど、それ以外の活動はいまいちだったかなぁ。来月以降はもうちょっと色々出来るといいなぁ。

削除依頼は8件削除対処。即時削除は6件削除。

昨日に続いて「ホノルルマラソン」の出典付け。今日は「歴代優勝者」節。これは公式サイトに全部結果が載っているので、それを出典にすればいいので助かる。念のためにデータが正しいかチェックしてみたところ、ウィキペディア側に間違いを二つ発見。

一つは、優勝者の国籍がオランダとなるところがニュージーランドになっていたというもの。なんでそんなミスになるかというと、オランダは英語で書くとNetherlandsなんだよね。軽く眺めた分にはNewzealandと間違えてしまっても無理は無い。しかし間違いは間違いなので修正しておく。

もう一つも優勝者の国籍。2010年の女子の部優勝者なんだけど、公式サイトにはUSAとある。しかしウィキペディアにはエチオピアとしてある。とりあえずUSAに修正してみたけど、もしかしたらエチオピア国籍でUSA在住という方なのかな。その方について日本語で情報が無いから確信が持てない。ともあれUSAであるという出典があるわけだから、ウィキペディアの編集としてはこれも正しいと言えるわけなんだけど。

Wikipedia‐ノート:索引」に、索引の振り仮名のスタイルを修正しましょうという提案が少し前に出されていた。例えば「アペール症候群」の場合に現行では「(-しょうこうぐん)」と漢字の部分にだけ振り仮名を振るスタイルになっているんだけど、これを「(アペールしょうこうぐん)」というように、全ての文字に振り仮名を振るようにしましょうという提案。正直、個人的にはどっちでもいいかなと思っていたんだけど、関連する議論を読んでみたところ、全ての文字に振り仮名をふると、読み仮名で検索が出来るようになるというメリットが書いてあった。なるほど、それは確かに便利になるな。現状の振り仮名の方法では検索には向いているとは思えないし。それに、全ての文字に振り仮名がふってあれば、jawptoolのLintIndex機能で読み仮名のチェック機能を強化できるかもしれないね。ということで、賛成意見を書いておく。

編集回数が3000回を超えた。まだそんなもんかという気もしないでもない。多ければいいってもんじゃないんだけど。

索引赤リンク除去作業も少し。これも少しずつでも進めていかないと終わらないからね。


あおやぎのさいと2.0 新人うぃきめでぃあん日記