新人うぃきめでぃあん日記:2011年8月

2011年8月1日

ウィキニュースで査読を2件と、査読に対して修正された記事の確認を2件。

ウィキペディアでは、管理者立候補の質疑に更に質問がきていたので回答する。

2011年8月2日

孤立したページとカテゴリ無しのページが更新されたので対応作業。

2011年8月3日

管理者立候補は二次質問期間に入った。あと半分だ。早速、一次質問の回答に対する二次質問が来ていたので回答。そしたら、すぐに更にそれに対する質問がきたので回答。ぜいぜい。

更に質問がきていると思ったら、中国語。なんで中国語。利用者ページを見にいってみたら、日本語はほとんど分からない方らしい。でも片言くらいはわかるみたいなんだけど。機械翻訳してみたところ、質問内容はとっても簡単で「中国語分かりますか?」というものだった。これ、どうしたらいいんだろう。無視してもいいような気もするんだけど。もちろん、回答したほうが親切だと思うけど、中国語わからないしなぁ。仕方ないので日本語と英語で「中国語は分かりません」って返事してみた。

後から考えたら、二次質問期間に入っていたんだから回答しないということも出来たんだ。というか、そうすべきだった。二次質問は一次質問の回答に対する質問だからね。うっかりしてた。この「うっかり」が私の良くないところだよなぁ。

久しぶりにjawptool。統計処理に発リンク数ランキングや外部リンクのホストランキングを追加したりとか。この辺で、そろそろリリースして区切りをつけたいところ。

更に中国(というか繁体字だから台湾かな)の方から質問が。中国語分かんないのにぃ。親切に日本語訳を付けてくれたんだけど、質問は「選挙結果を日本語が分からない人にどうやって伝えたらいいのか」って。それ、私が対応しなきゃいけないことなのかな。もしかして、こういうアクシデントがあった場合にどう対応するか試されているのかなとか疑心暗鬼になってみたり。そんなことはないと思うけど。

ご相談には、残念ながら私では力になれそうにない。それに、管理者立候補への質疑に該当しないと思うので回答自体をしないことに。ご相談は「Wikipedia:井戸端」でどうぞと案内しておく。

会話ページにメッセージが!何事かと思ったら、私が出典無く立項した点を質疑で突っ込まれた「井上きみどり」さんの記事への参考資料のご提示。うわー、わざわざ調べていただいて申し訳ない。ていうか、井上きみどりさんのブログに載ってる記事だよ。それくらい自分で調べなきゃダメだよな。情けない。新聞記事なんで、早速明日にでも図書館に行って記事をコピーしてこよう。

わー、また中国人さんから質問が。私、この人に何かしたかなぁ。名前はかすかに見た記憶があるんだけど、特に絡んだ記憶は無いんだけど。

質問は「貴方を選ぶ理由はなんですか?選ばれなければならない理由はありますか?」というもの。選ばれなければならない「must」な理由なんてあるわけない。それに、選ぶのは私ではなくコミュニティ。コミュニティがふさわしくないと判断すれば不信任されるでしょう。ということを答えるけど、流石にこれを意味まで正確に英訳する自信は無いので、申し訳ないけど日本語のみで回答。

2011年8月4日

中国人さんから更に返事がきていて「失望した。貴方は大事な質問から逃げた」だそうだ。逃げたのかもしれないけど、そこまで酷く言われるほどのことはないと思うんだけどなぁ。まあ、言語の壁があるから、ミスコミュニケーションの可能性もあるけど。

想像するに、この方って管理者審議をウィキメディア財団の理事選挙か何かと勘違いしているんではないだろうか。中国人にも知らせないととか言っていたのも、そうだとすると納得いくし。「管理者」というのは、中国語では何か特別な意味があるのかもしれない。JAWPでも「管理者」という訳語は不適切だという意見があるくらいだし。

想像だけど、というように思うことにして、この件はこれで流すことにする。

昨日の「井上きみどり」さんの新聞記事を求めて図書館へ。近所の図書館には過去版が蔵書してないようなので、少し遠い大きな図書館まで行ってみたら、ちゃんと蔵書されてた。記事も見つかったのでコピーしてくる。ToDo一つ完了。

2011年8月5日

ウィキニュースの会話ページに管理者さんからコメントが。曰く「査読時に明らかな誤りなどは修正してしまって構わない。そうすれば、次の人が査読してOKならすぐに公開できるので」とのこと。これからは仰せの通りにしよう。

そのウィキニュース。査読でコメントしていた記事が修正されているので、それぞれ確認。問題はないのだけど、やっぱり自分では公開できないというチキン。

東京ドーム (単位)」の改名提案なんだけど、実は提案者の方がソックパペットとして無期限ブロックされてしまった。どうしたものかと思ってたんだけど、ソックパペットによる異常提案を理由に終了してはどうかという提案があった。終了自体には賛成だけど、理由は合意不形成にしておいたほうがいいのではないかとコメントする。なぜなら、提案時点でブロックされていなかった場合には、その提案は有効という考え方もあって、これについては今「Wikipedia:井戸端/subj/ブロック済ユーザーの多重アカウントによる削除依頼について」で議論中なので。もう一つは、提案者不適格を理由にしてしまうと、可能性として他の人が即座に再提案することが出来てしまう。しかし、実際には合意形成が難しい状況なので、再提案はして欲しくない。なので、合意不形成を理由にしたほうがいいんじゃないかと思う。

提案から一週間以上経ってしまった「トライシクル」と「三輪タクシー」。賛成意見のみなので統合を実施。

井上きみどり」さんの記事にようやく出典を付記。

管理者立候補にその後の二次質問は無く、質問期間が終了。1日のインターバルをはさんで、いよいよ投票期間だ。さーて、どうなりますことやら。ちなみに私は経緯を見守るほどの図太さが無いので、投票期間中はウォッチしない予定。見事なチキンハートだ(笑)。政治家さんが選挙速報は隠れ部屋でこっそり見て、当選したら表に出てくるのと心境は似ているのかもしれない。

ウィキニュース。私が査読で関連記事としてはどうかと挙げた2本の記事の内、1本はまだ査読中だった。がーん。確認漏れ。情けなや。ということで、それは除去する。あと、猫が電車を止めたという脇ニュースの査読をするが、こちらは特に問題はみつからなかった。

2011年8月6日

ウィキブレイク

2011年8月7日

今日もウィキブレイク。色々現実世界が忙しくて。管理者投票はどうなってるのかなぁと気にもなるんだけど、やっぱり見る勇気がないのでまだ見ない。

2011年8月8日

またしても久しぶりにjawptool。少々デバッグをして、一度本番データに掛けてみる。これで問題が特に無ければ、0.13としてリリースしよう。

と思って実行したんだけど、statistic(集計)機能が項目をたくさん追加したからか、メモリを食うようになってスワップしてる。うーん、どうしよう。処理を分けて行うようにすればメモリ消費量は削減できるけど、そうすると遅くなる。と言ってもスワップするよりは速いだろうけれど。でもまあ、とりあえずはVMwareの割り当てメモリを増やせば解決することなので、今回はそれで乗り切って、今後の課題にしよう。

2011年8月9日

実行結果が問題なかったので、jawptoolの0.13をリリースする。次は新機能を追加していって0.20を目指したいなぁ。

新しいデータベースダンプが公開されていたのでダウンロード。8月8日版。

ふと疑問に思った。いつもjawptoolで使っているデータベースダンプは"jawiki"になっている。しかし、ウィキペディアはウィキメディア財団の行う複数のプロジェクトの一つだ。jawikiをウィキペディア日本語版のダンプだと思ってたけど、もしかしてこれって他のプロジェクトも含めた日本語版の全てのダンプになってる?もしそうなら、まずいような気がする。というか積極的にまずい。ということで調べてみたところ、http://dumps.wikimedia.org/backup-index.html にちゃんとプロジェクト別にダンプ一覧が掲載されてた。ほっと一安心。それにしても、ウィキペディアのダンプが"jawiki"なのはネーミングとして問題があるような気がするけど、多分歴史的経緯から変えられないんだろうね。

2011年8月10日

ウィキブレイク。どうも夏バテ気味……。

2011年8月11日

ちょっと思い立ってウィキメディアの旅。今日は「ウィキソース」を訪ねてみる。ウィキソースは様々な文書の原本の収録を目指すプロジェクトとある。もちろん著作権の切れてない文書は収録できないけど。日本には似たようなプロジェクトとして「青空文庫」があるけど、青空文庫は基本的に文学作品を対象としているのに対して、ウィキソースはそれ以外にもおよそ文書であれば何でも収録するという点が違うのかな。

しかし、文学作品だって収録するわけなんだから、とりあえず青空文庫に収録されているテキストはコピーしてきて文書の充実を図るのはダメなんだろうか。ウィキソース日本語版については、青空文庫と協力することで、相互にメリットはありそうに思うんだけど。

あと、ウィキソースでは法律とか判例とかも収録対象になってる。これなんてgo.jpサイトで公開されているものが多数あるわけだから、それもコピーしてきたらいいんじゃないかと思うんだけど、どうなんだろう。

まあ、いつものことだけど、多数の人が何年も掛けて積み重ねてきた活動に対して、首を突っ込んだばかりの人がポッと思いついた思考程度が考慮されてないということは滅多にないわけで、とりあえずしばらくはサイトをよく読んで勉強しよう。

更にウィキメディアの旅。確かウィキトラベルというプロジェクトもあったようなぁと思ったんだけど、プロジェクト一覧に載ってない。なんでだろうと、とりあえずぐぐってたどってみたら、もちろん「ウィキトラベル」は見つかった。しかし、何か違和感がある。ベクタースキン(ウィキメディアの現在の標準のサイトデザイン)ではないというのもあるんだけど、それ以外にもなにかあるような。しばらくして気がついた。広告が出てるよ!ということは、このサイトはウィキメディアのプロジェクトではないということだ。そうだったのか。でもウィキペディアの記事からリンク張られているのを見たことがあるぞ。あれはプロジェクト間リンクではなく、単なる外部リンクだったのか。

ウィキメディア財団はその運営の全てを寄付金によって賄うことになっている。広告を掲載すれば寄付金なんて必要ないくらいの収入は得られるだろうけれど、あえてそうしないことになっている。だから、ウィキメディア財団のプロジェクトサイトには一切の広告が無い。つまり、広告があるウィキトラベルはウィキメディア財団のプロジェクトではないということだ。

ウィキトラベルがウィキメディア財団のプロジェクトで無いからといって別に問題があるわけではないんだけど、気になったのは「では誰が運営しているのか?」ということ。しばらくサイト上をさ迷ったんだけど、その情報を見つけることが出来なかった。ちょっともやもやする。

2011年8月12日

久しぶりにウィキペディアで孤立したページとカテゴリなしページの作業。ここんところ、バテてたからなぁ。って、回復したわけでもないんだけど。

各種依頼の長期積み残し案件を眺めていく。「山崎お栄」の改名提案は反対票が入っているんだけど、いずれもソックパペットとして無期限ブロックされている。この場合、投票は無効になるので、結果として反対票はなかったということで、改名合意成立ではないだろうかということでコメントする。

アルファ (ミュージシャン)」にメンバーの記事を統合する提案も、反対票は入ってないのに止まってる。提案者さんがお忙しいということなので、代理で統合作業をしましょうかとコメント。

長期積み残しではなく新規案件だけど、目に留まったのが「FM-7」に「FM77AV」「FM77AV40SX」を統合する提案。元FM77AVユーザとしては、やはり一言言っておきたい。いや、別に言わなくてもいいんだけど。

個人的な見解としては、FM77AVはFM-7とは別物なので、記事も別であるべきだと思う。でも、現状のFM77AVの記事はスタブ状態なので、一旦統合はやむなしかなということで、消極的ながら賛成票を入れておく。

2011年8月13日

昨日色々コメントした件。「山崎お栄」は無事に改名された。「アルファ (ミュージシャン)」は提案から時間が経ちすぎているということで終了となったので、同じ内容で再提案する。

FM-7」については、一つの記事にまとまっていたほうが見通しがよいのではないかという意見が出される。そういわれれば、確かにそうだな。試しに「PC-8800シリーズ」「X68000」などをみてみたけど、いずれも一つの記事にまとまっているな。ならば統合した方がいいかなぁ。

おっと、管理者に新たな立候補者が。ここんところ、たて続けだなぁ。これは、権限を付与する係であるビューロクラットさんは大変かも。

ウィキニュースで久々の査読。短信も書きたいんだけど、なかなかいいニュースが無い。いや、ニュースが無いわけではないのだけど、どれか一つを選べと言われると難しいなぁ、と。別に一つに絞ることもないんだけどね。

今日は私の管理者投票の結果の出る日。これまで怖くて結果が見れなかったけど、意を決して見てみようとしたところ、先に結果がわかってしまった。どういうことかとういと、MediaWikiにはウォッチリストという更新チェック機能がある。ここにウォッチしたいページを登録しておくと、そのページが更新されたらそれが一覧に表示されるようになっている。RSSリーダとかアンテナとかに近い機能と言っていいかもしれない。んで、このウォッチリストには自分自身の利用者ページも登録されているので、自分のアカウントに関する変更があった場合にも表示される。そこに、私に管理者権限が付与されたというのが通知されていた、と。なんかあっけない。

それにしても信任か。厳しい質問もあったし、どうかなぁと思ったんだけど。改めて投票ページを見てみると、当然ながら満場一致なんてことはなくて、少なくない反対票もあり、それに付随したコメントも頂戴している。これについては、しっかりと肝に銘じて今後の糧にしたいと思う。

管理者になると当然のことだけど、管理者権限が行使できるようになる。もう当たり前すぎる話。で、この管理者権限の行使方法だけど、普通のウィキペディアの編集機能にボタンが追加されるわけなのね。まあ、それも当然の話なんだけど、あまりにも普通の位置にあるから、ついうっかり操作しそうで怖い。いや、怖がってちゃいかんのだが。

ちなみにどんな画面になるかは、「Help:管理者マニュアル」とかにスクリーンショット付きで説明されている。この画面はモノブックスキンで現在標準のベクタースキンではないんだけど、要領は一緒。

で、このボタン群がどのページでも有効なわけですよ。当たり前だけど。例えば「メインページ」なんてのは保護されていて誰にも手出しできないページの筆頭と言えるわけだけど、管理者だと普通に編集できるし削除だって出来る。もちろん、そんなことをしたら一発で管理者を解任されるだろうけれど。つい間違えてクリックしてしまいそうだけど、他の管理者さんはそういうことはないんだろうか。

2011年8月14日

カテゴリなしと孤立したページが更新されたので作業。なんとなくだけど「国際戦略港湾」はできそうだったのでWikifyしたり出典追加したりしてみた。

管理者立候補の時に出典の無い記事を作成したことを問題視されたので、今更ながら出典を探してみたところ、「Adobe Flash Media Server」「影舞」について出典が見つかったので加筆。つか、こんなにすぐに見つかるんだったら、とっととやっとけって話だよな。

久しぶりにウィキニュースに短信。ベルリンの壁50年という記事と、第二東名高速道路の一般開放の記事。

私がウィキニュースに参加するようになって1ヶ月は経ったかな。ということでこの時点の感想だけど、一番は参加者が少ないことだよなぁ。ウィキニュースはウィキペディアと違って、記事に「執筆」「査読」「公開」の三つの段階がある。特にガイドラインに明記されているわけではないけど、多分執筆開始から公開まで多数の参加者で作業することで数時間から1日以内くらいで終わらせることが想定されているんじゃないかと想像する。だって、ニュースサイトだもんね。いくらいい記事でも、何日も経ってから公開されても、ニュースとしての価値は少ない。情報の蓄積としては意味はあるけど、それはウィキニュースのメインの目的ではない。

で、現状のウィキニュース日本語版だけど、参加者が少ないことから、この執筆から公開までの時間が非常に長くなっている。数日から一週間、ときには1ヶ月以上かかったりもする。それだけ経つとニュースとしての価値も少なくなる上に、情報源がリンク切れになったりするので、査読で指摘が入って執筆のやり直しになったりして、更に時間が掛かる。最終的には情報源が全部リンク切れになったり時間が経ちすぎて放棄記事になってしまったりする。非常にもったいない。

ざっと見てだけど、ある程度コンスタントにウィキニュースの編集に参加している人って、今は4から5人くらいじゃないだろうか。これはいくらなんでも少ない。多分、これが10人くらいになったら、だいぶサイクルがよくなって活性化するんじゃないかと思うんだけど。ということで、これを読んで面白そうだと思った方。ウィキニュースの編集に参加してみませんか?

またしても久しぶりにjawptool。これまで削除依頼の長期積み残しチェックをLintTextの一機能としていたんだけど、これだけ独立した機能にしたほうがわかり易いかなと思って分離。

2011年8月15日

私が管理者になったことを友人とメールでやりとりしてたんだけど、そこで友人がありがちなことに「管理人」って言葉を使ったのね。でまあ、管理人って呼ぶと怒る人がいるんだよという話をしたんだけど、そこでちょっと振り返ってみて不思議に思った。3ヶ月しか経験の無い私ですら、これまで何度も「管理人って呼ぶと怒る人がいるから」という文章を見たことはあるんだけど、実際に怒っている人を見たことはない。もしかして、怒る人ってほとんど居ないんじゃないのかな。少なくとも私は自分がそう呼ばれて怒るつもりは全然ないし。言葉だけが一人歩きしてる状態なのかなぁと、ふと思った。

jawptool。「生没同日」という記事がある。誕生日と亡くなった日が同じ人物を集めた記事。これまでどうやって該当人物を収集していたか分からないんだけど、こういうのこそ自動処理すると楽になるでしょう。幸い「Template:死亡年月日と没年齢」というのがあるので、これを抽出すれば生没年月日が分かる。全ての人物記事にこのテンプレートが適用されているとは限らないけど、それはそれ。100%を目指す必要はなくて、多少なりとも助けになればそれでよしだし。

ということで機能を実装。抽出したところ、面白いほど簡単に見つかる。当たり前だけど。まあ、見つかったのは10件くらいなんだけどね。それでも、ウィキペディアでは未発見の生没同日人物をこれだけ見つけたんだから、凄いと個人的には思う。自画自賛。

ただ、問題がないわけではなくて、テンプレートで判断しているから、テンプレートの使用を間違っていると誤判定する。だから、結局は個々の記事を調べてみないといけない。で、「オットー・ネルツ」という記事がそうだった。テンプレートは10月21日で本文は4月18日と、没月日が一致しない。どっちが正しいのかと英語版を見てみたら4月18日の方が正しそう。しかし、この方ドイツ人なんで多分ドイツ語版が一番正確なはずと見にいったら、4月19日になってる!一体どういうことー。更にドイツ語版にあった外部リンクのサイトを見ると、没年が違ったりする。どれが一番正しいのぉ。わけが分からないので、調べたことをノートに書いて質問してみる。

管理者になると管理者専用のメーリングリストに登録することになる。ということで私も登録していただいたので、早速ご挨拶のメールを送る。

2011年8月16日

管理者作業の練習で、サブページを作って一通りやってみた。手順は以下の通り。

  1. 「/test」を作成。本文は「test page」
  2. 「/test」を時間指定(1時間)編集保護。
  3. 「/test」を非ログイン状態で編集できないことを確認。(保護の確認)
  4. 「/test」を編集する。本文を「test page ver 2」(保護ページ編集の確認)
  5. 時間経過後、自動的に保護が解除されることを確認。
  6. 「/test」の初版を版指定削除。(版指定削除の確認)
  7. 「/test」を移動保護。(移動保護の確認)
  8. 「/test」を移動し、警告が出ることを確認(管理者は保護状態でも移動できるため)。
  9. 「/test」の移動保護を解除。(保護解除の確認)
  10. 「/test」をリダイレクト非作成で「/test1」に移動。(リダイレクト非作成での移動の確認)
  11. 「/test2」を作成。本文は「test page 2」
  12. 「/test1」を「/test2」に上書き移動。(上書き移動の確認)
  13. 「/test2」を削除。(削除の確認)
  14. 「/test2」を復帰。(復帰の確認)
  15. 「/test」を作成保護。
  16. 「/test」が作成で警告が出ることを確認。(作成保護の確認)
  17. 「/test」の作成保護解除。
  18. 「/test1」「/test2」を削除。(掃除)

これでブロック系以外は一通り試せたかな。あ、巻き戻しが入ってないな。まあいいか。これだけやったら、大体の要領はつかめたし。

FM-7」を統合作業をされた方から、念のために確認を依頼されたのでチェック。統合に問題はないし、加筆された部分もおかしいところは無いかな。ただまあ、全体の構成が雑多な状態になっているので、そこを見直していきたいよなぁ。あと、現状出典が全然無いので、それもなんとかしないと。画像が無いのも寂しいから、これは画像依頼も出してもいいかもね。ということで、ToDoがどんどん積みあがる。

1日1短信。今日は日本航空がカンタス、三菱商事と組んでLCCを立ち上げるニュース。が、書いてから気がついたけど、この書き方じゃ日本航空POVだ。ということで、三社を平等に扱うように文章を修正。

jawptool。索引に登録されていない記事を抽出する機能を作ってみる。実行してみた結果、登録されてないのは22万件ほど。思ったより少ない。全体が76万記事だから7割くらいは登録されているわけだ。みんな、結構まめに索引に登録してるんだね。もっと登録率が低いかと思った。しかしまあ、だからといって実際に索引に登録することを考えたら22万件というのは物凄く多いわけだけど。

2011年8月17日

引き続きjawptoolの索引未登録記事の一覧。どうせなら読み仮名でソートされているほうが、登録するときに楽だろうということでソートする処理を追加。しかし、問題は読み仮名が分からないということなんだよなぁ。大抵の記事には定義文に読み仮名は書いてあるけど、書き方はフォーマットがあるわけじゃないから自動で切り出せないし。デフォルトソートから取得する方法もあるけど、これは清音になっている上に、索引の並び方とルールが違うという問題もあるし。でも、何もしないよりマシだろうということで、デフォルトソートを使ってソートする。

並行してIRCで管理者業務の手ほどきを受ける。ウィキメディアプロジェクトでは、結構IRCが活用されている。あ、IRCというのはInternet Relay Chatのことで、まあ要するにチャットなわけです。でまあ、ウィキメディアのプロジェクトごとにIRCチャンネルが用意されている他、管理者用のIRCとかもあるわけです。私はこれまでメーリングリストには参加してたけど(読むだけだけど)、IRCには参加していなかった。でも管理者になったらIRCで直接やりとりしながら作業する方が便利かなと思って参加するようにしたわけです。

で、そのIRCで自分一人では出来ないブロックのテストを、レクチャーを受けながら一通りやってみる。それにしてもまあ、どきどきするね。間違ってブロックしても解除できるから別に致命的な問題ではないんだけど。

まずブロックする。ブロックする期間はテストなんで5分に設定。これは無事出来た。当たり前だけど。次にブロック解除の手順なんだけど、IRCで細かく質問しながらやってたら5分過ぎて自動的に解除されてしまった。がーん。ということで、またブロックのテストからやり直し。最初だけとはいえ、つまらんことで他の方に手間を掛けさせてしまっているよなぁ。申し訳ない。

ウィキニュースの短信。今日は三つ。ジャニー喜多川さん宅で立てこもり、東証と大証が統合の計画、泊原発が営業運転再開。

孤立したページとカテゴリなしページの更新があったので作業。1件、ちょっと面白いというか梃子摺ったのがあった。「スペキオススシカクワガタ」という記事が孤立していたんだけど、このクワガタムシが属する「シカクワガタ属」にはちゃんとリンクがあるのに赤リンクになってる。なんでだろうと不思議に思って、もしかしてどれかの文字が半角カタカナかもと思ってテキストエディタにコピペしてみたけど全角。しばらく、なんでだろう、なんでだろうと考えて、文字コードを調べてみてやっと分かった。「ペ」が平仮名だった。こんなん、目で見てわかるかー!!しかし、サクラエディタはカーソル位置の文字の文字コードを表示してくれるので、それでやっとわかった。ありがとうサクラエディタ。

でまあ、改名するわけだけど、これは明らかに誤記だから提案は必要なくて即時改名が可能。普通に改名(移動)するとリダイレクトができてしまうわけだけど、私は管理者だからリダイレクトを作成しないことも出来る。でも、それって職権乱用だと思うので、素直にリダイレクトを作成して移動。出来てしまったリダイレクトは、即時削除可能なのでタグを貼る。これまた自分で削除することも出来るんだけど、それもやらない。お手数だけど、他の管理者の方にお願いすることにする。なんとなくだけど、自分が編集者として作業しているときに管理者権限を行使するのって、権限の私物化のような気がするから。まだ自信が無いからというのもあるけれど。

このあいだウィキニュースに参加者が少ないということを書いたけど、参加者の数って大事だよね。ウィキメディアプロジェクトに共通する方針の一つに中立性があるけど、中立性というのは個々の記事が中立に書かれていることだけが中立性ではないと思う。プロジェクト全体として中立になるように、様々な分野・方面の記事があることも大切ではないかな。極端な話、一人の物凄い優秀な人が居たとして、その人だけが記事を書いたとすると、その人POVなプロジェクトになってしまう。全部正しいことが書いてあっても、ある分野とかある特定の事項の記事を「書かない」ということで、全体の中立性をゆがめることが出来るよねってこと。だから、中立性のためには、参加者の数が大事ではないかなぁと思う。だから、みんなウィキニュースに参加しよう(笑)。

2011年8月18日

オットー・ネルツ」についてノートでお返事があった。ありがたい。英語版が18日なのは、多分アメリカ時間で記述されているんではないかととのこと。なるほど、それはありえそう。でも、それっていいのかな。USPOVな記述だと思うんだけど。あんまり自信はないけど、生没に関わらず何かが起こった日時というのは、その現地時間でいうのが標準的ではないのかな。ともあれ、同時に示していただいたサイトで19日となっているので、それを出典として19日に修正する。

ウィキニュースの短信。東電管内で電力需要が今夏最大を記録した記事と、なでしこジャパンの国民栄誉賞表彰式のニュース。

ウィキニュースで気をつけないといけないこと。それは記事の日付。これは短信にも当てはまる。もっとも、短信の場合は日付ごとにページが自動作成されるから、記事を書くときはそこに項目を追加するだけで済むんで、それほど気にすることはないんだけど。

で、日付がどういうことかというと、記事の日付はその記事を"書いた"日付でないといけないということ。昨日の事件だからといって、昨日の日付で書いてはいけないわけ。事件から何日か経って「あーこの事件って結構大事だったから記事にしといたほうがいいな」と思ったら、今日の日付で記事で作成しないといけない。もちろん、本文中に事件があった日付はそれはそれで書くわけだけどね。

以上、今更ながら、自分でもちょっとうっかりしそうなので、備忘として書いてみた。

jawptool。索引に掲載されている記事の内、赤リンクなものを一覧する機能を追加する。わりとさくっと出来上がる。サブルーチンが揃ってきたから、機能を追加するのも楽になってきたなぁ。いい感じだ。

で、レポートをみたところ、現時点で2500件くらいあるようだ。意外と少ない?これは除去してしまっていいような気がするんだけど、念のために索引のノートページで質問してみる。過去ログも見てみたけど、赤リンクについて触れたものはなかった。ただ、索引不要論が何度か繰り返し提議されていたのね。確かに、紙の百科事典ではないから、索引の必要性は低いと言えばそうかも。全文検索が出来るから、知りたいキーワードが分かっていれば、索引をひくよりも検索したほうが早いし。

更に機能追加でリダイレクトのlint機能を作ってみる。とりあえず、記事名に括弧が付いているリダイレクトは有用でない可能性があるのでチェックしてみたら、かなーりたくさん出てきてしまった。これどうしようかね。全部リダイレクトの削除依頼に掛けるというわけにもいかないだろうし。

いつまでも怖気づいてはいられないということで、管理者初作業。手始めに、保護ページの編集依頼が出ているものに対応することにする。編集対象は三つ。「山里亮太」「ONE PIECE」「AKBINGO!」。他に「MediaWiki:Common.css」も依頼が出ているけど、これは流石に失敗したら影響がでかすぎる(ウィキペディア日本語版の全ページに影響が出る)ので控えておく。

まず依頼内容が正当かどうかを調査。それぞれ正当なようだ。次にIRCで他の管理者さんに念のために作業の確認をとって着手。それにしても緊張するな。初編集の時を思い出すというか。もちろん、失敗したところでwikiだから修正できるんだけど「管理者が失敗した」だとかなり恥ずかしい。自意識過剰かもしれないけど。

ということで、なんとか二つは編集を終えた。「山里亮太」についてはちょっと気になる点があったので、編集は控えて依頼者さんに質問してみることにする。他は対処を報告して確認を依頼。

2011年8月19日

索引の赤リンクの件。まだノートには返信は無いけど、多分全部除去して問題ないよな。まだしないけど。で、思ったんだけど機械的に除去できるんだったら、これはボットの仕事ではないだろうか。jawptoolの開発が落ち着いたら、ボットも試してみるかなぁ。

ボットというのはロボットのこと。って、これじゃ言い換えただけやな。この場合は一般的なメカメカしたロボットではなくて、自動処理するプログラムのこと。ウィキペディア/ウィキメディアでは多数のボットが作られて実行されていて、簡単かつ自明な編集はボットがやってくれることが多い。

索引とボットといえば、索引の曖昧さ回避記事には「【曖昧さ回避】」と記入することで合意されているんだけど、たまに「【曖昧】」と省略して記入されている場合がある。これもボットで機械的に修正してしまって構わないような気がする。もちろん、実際にやる前にノートで相談するけど。こうして考えると、ボットネタも色々あるな。やっぱりPython勉強しよう。

管理者立候補のときに質疑された中国人さんが、会話ページにやってきて、私の先日のブロックについて抗議すると仰っている。しかし、それは誤解でテストで行っただけですよと説明してみたけど、理解してもらえるかなぁ。

山里亮太」の件については依頼者さんに確認が取れたので修正を実施。確認もしていただいて完了。

ウィキニュースの短信。今日は東日本大震災のボランティア贋医師逮捕と、アウン・サン・スー・チーさんがミャンマー大統領と会談したニュース。

jawptool。索引記事のうち、巨大なものを抽出する機能を作ってみる。とりあえず閾値は100KBにしてみた。巨大なものは、分割を検討してもいいんじゃないかということで。

2011年8月20日

管理者作業をちょこっと。移動依頼が出ているんだけど、移動先に有意な履歴があるので移動依頼では対処できない案件。ということで、対処できないですというコメントを書く。

jawptool。よく考えたら索引記事が巨大かどうかの閾値なんて一概に決められないわけだから、全部の索引記事についてファイルサイズを付けて出力したほうがいいよな。ということで修正。

jawptoolの開発も実行も、今はVMware上のFreeBSDで行っている。しかし、VMwareのオーバーヘッドがあるから、その分処理が遅い。これをホスト環境(WindowsXP)上で実行できれば速くて便利だよなぁ、ということで試しに実行してみた。が、なぜか途中でハングアップしてしまった。なんでだー。Windows 7とかだと、こんなことはなくなるのかなぁ。もしくは、ホスト環境をFreeBSDかLinuxに乗り換えるかなぁ。

図書館に行って新聞記事探し。立項した記事で出典が無いことを問題視されたけど、当然のことながら加筆したものでも出典がないものがあるんだよな。全然威張れないけど。ということで、そういう記事について出典の新聞記事を探してコピーを取ってくる。全てが完全にとはいかないけど、こうして一つでも出典をつけて記事として成長させることができるといいよなぁ。

関西ウィキメディアユーザ会がオープンソースカンファレンス名古屋でセミナーをするという話があったような気がする。行ってみようかなぁと思って日程を確認したら今日だった。がっくし。だめじゃん。うーん、次の機会に期待しよう。

関西ウィキメディアユーザ会というのは、関西のウィキメディアのユーザ会。そのままやな。私もウェブサイトを見ただけで実際の活動を見たわけではないんだけど、オープンソースプロジェクトによくあるユーザ会のウィキメディア版ということでいいんじゃないのかな。結構活発に勉強会を開催したり、イベントにブースを出したりしているらしい。

そういえばセミナーと一緒にウィキマニアの報告会をすると見たような気がするんだけど、今確認したらそんなことは書いてないな。どこで見たんだろう。

ウィキマニアというのは、全世界のウィキメディアンの集まるお祭り。って、お祭りでいいのかな。今確認したら国際会議ってなってる。そうなのか。

で、そのウィキマニアは年に1回世界各地を持ち回りで開催されているんだけど、今年はイスラエルのハイファというところで行われたらしい。で、そこに参加した方が報告会をされるという話を見たような気がするんだけど、どこで見たんだったっけか。

2011年8月21日

このあいだ行った保護ページの編集について、コメントが出ている。ノートでの合意形成の上で編集依頼のはずではないか、とのこと。「山里亮太」については、確かにその通りだった。実際には一つのページに二つの依頼があって、一つにはテンプレートでは合意があったともみなせるんだけど、もう一つの依頼は全く議論がなかった。これは完全に私のミス。いけません。「ONE PIECE」については、場所が分かりにくいけどノートで合意があったので、その点をコメントする。

2011年8月22日

ウィキニュースの短信。リビアのカダフィ政権崩壊間近のニュース。この政変って、今年の初めのジャスミン革命から始まってるんだよねぇ。途中、東日本大震災があったから、うっかり忘れそうになってたけど、世界は動き続けているんだ。

1件査読して問題なかったので公開してみた。初めての公開なんで、ちょっとドキドキ。多分大丈夫だろうと思うんだけど。公開したのは「訃報 グァルティエロ・ヤコペッティ氏 - イタリアの映画監督 『世界残酷物語』など」という記事。

あと、査読について分からないことがあったのでノートで質問。記事の執筆に関わった人は査読と公開は行ってはいけないんだけど、それは「雑草とり」のような些細な編集でも該当するのかどうかということ。個人的には、雑草とり程度なら構わないような気がするんだけど、では一方でどこからがアウトかという線引きは難しいから、一律に執筆者は全員査読不適格とするのもありな気がする。

jawptoolのメッセージをちょこっと修正。全然関係ないのかもしれないけど、もしかしたらjawptoolのlint結果を元に編集した人が注意されているのかもしれないと思えるのを見かけたから。まだまだα版だから特にドキュメントが十分じゃないわけで、lintを元にウィキペディアで修正を行うには、それぞれのガイドラインをしっかり理解したうえで行わないといけないんだよね。私は一応分かっているつもりだけど、レポートだけ見た人がそこまで理解しているという保証はないし。そういう意味では、lint結果はドキュメントをしっかり整備するまでは公開しないほうがいいのかもしれない。ということで、今更だけど公開中止。

IRCで何気に更新履歴を眺めていたら荒らしを発見。複数編集していたので管理者機能のひとつである「巻き戻し」を使ってみる。が、凄いねこれ。同一編集者の編集が一気に取り消されるの。いや、そういう機能だから当たり前なんだけど。でも、確かに荒らし対応に有効なツールだわ。

で、その荒らし内容が一般人と思われる氏名の記載だったので、版指定で削除依頼も提出。そこまでしたら結構時間を取られた。この時間的なコストを考えると、荒らしとの戦いは荒らし側が有利だよなぁ。どうしたって荒らしに対応する側の方が時間が取られるんだから。そういう意味では、管理者が増えて手が多くなるのが、手っ取り早い対策ということになりそうな気がする。

jawptoolで処理するためのデータベースダンプは2010年2月26日版以降の分は一応全部手元に保存してある。原則的にjawptoolで処理するのは最新のデータのみなんだけど、過去のデータからの推移をみるようになることもありえるかと思って。まあ、そういう用途には履歴付きデータをダウンロードしてきてもいいんだけど。

でまあ、このダンプデータがなんだかんだいって、結構でかいわけですよ。これだけ集まると。現時点で50ファイル、66GBになってる。現状はbzip2で圧縮されているけど、これを7-Zipで圧縮し直したらかなり小さくなるんじゃないだろうか。と思って圧縮してみたんだけど、意外と縮まらない。1割から2割くらいかな。bzip2から更にこれだけ縮まっているとも言えるんだけど、期待したほどの効果ではなかった。なら、手間も掛かるし、現状のままでいいか。HDDからあふれるのにはまだ数年は掛かるだろうし、それまでにPCも買い換えるかもしれんし。

版指定削除依頼はスムーズに削除していただいた。が、私の指定した版では漏れがあって、その他の版も削除していただいた。いかんなぁ。これもうっかりミスだよなぁ。

竹脇無我さんが亡くなったとのニュースが入ったので短信追加。こういう活動をしていると、人の死を待ち望んでいるようでいて、後ろめたい感があるんだけど、本職のジャーナリストさんとかはどうなんだろう。

jawptool。「xxxx年」とか「xx月xx日」というような記事があって、その年や日に起こった出来事などが一覧されているんだけど、その内の一つに著名人の誕生と死去がある。これについては、生没同日検出で使った「死亡年月日と没年齢」テンプレートを使えば自動的に検出できるよな。ということで、各記事に未掲載の人物を一覧に出力する機能を追加する。

それにしてもjawptoolも随分と機能が増えてきた。いい感じだ。多分、アイデアを募れば、もっといろんな機能が作りえると思うので、これを読んで「こんな検出とか出来るんじゃない?」と思う人は提案してくれると嬉しい。必ず実装するとは約束できないけど、出来るだけ参考にはしたいと思うので。

先ほどの生誕と死去の年月日記事への未掲載人物だけど、実行してみたら物凄くいっぱいみつかってしまった。これ、どうしよ。現状、ほとんど掲載されていないということは、年月日記事への掲載基準とかあるのかな。そういう議論ってどこでしてるんだろう。「プロジェクト:人物伝」とか、関係ありそうな気もするけど。あと、機能を作ってから気が付いたけど、年については生年と没年のカテゴリがあるから、そこで既に情報は集まっていて、記事に一覧する必要は無いとも言えるんだよね。うーん、どうしたもんだか。

2011年8月23日

索引の赤リンクについては、除去しても構わないだろうというコメントがあった。なら大丈夫かな。と言っても件数が多いのでそう簡単にはいかないけど、ぼちぼち作業をしていこう。

代理で統合提案をしていた「アルファ (ミュージシャン)」は反対票がなかったので統合を実施。しかし、メンバー3人の記事を統合するので、ボリュームがあって結構大変。それでもなんとか統合作業完了。ToDoが一つ果たせてよかった。

そういえばすっかり忘れていたけど、孤立したページとカテゴリ無しのページ。それぞれ作業する。なんか久しぶりだな。この日記を読み返してみたら、前回は17日だから一週間ぶりか。更新を1回飛ばしたことになるな。

jawptool。記事名一覧の出力に、これまではData::Dumperというモジュールを使っていたんだけど、これをやめて自力で行うように変更。なんでData::Dumperを使わないようにしたかというと、理由は二つ。一つはData::DumperではUTF-8文字がエスケープされるのでファイルサイズが大きくなること。もう一つはData::Dumperは一旦出力用の文字列を作るんだけど、配列やハッシュが巨大だとこの文字列も巨大になってメモリを消費する。ということで修正。ついでと言ってはなんだけど、名前空間毎にファイルを分けるように変更した。これで、後で扱い易くなるかな、と。

ウィキペディア、ウィキニュースときて、次は「ウィキソース」に参加してみたいなと思ってる。と言っても、その辺で打ち止めで、それ以外のプロジェクトには多分参加は難しいと思ってるんだけど。「コモンズ」に画像を投稿するというのはあるかもしれないけど。

コモンズというのは、ウィキメディアプロジェクト全体に対してメディアファイルを提供するところ。昔は画像や音楽ファイルなどを各プロジェクト毎に保有していたそうなんだけど、そうすると重複して無駄になったり、あっちのプロジェクトにあるファイルがこっちのプロジェクトには無くて使えないなんてことが起こる。ということで、メディアファイルを集約するプロジェクトとしてコモンズが立ち上がったということらしい。なので、新規にメディアファイルを提供する場合は、各プロジェクトに対してではなく、コモンズに提供することが推奨されている。

で、話は戻ってウィキソース。著作権の縛りの無い文書の原本を投稿するわけだけど、何を投稿するか。とっつき易いのは、やっぱり文学作品だろうね。ただ、これには言語の素養の壁がある。源氏物語とかの古典作品だと、そもそも原文を読むのに古典の素養が必要になる。実際、いくつかのウィキソースに投稿されている古典作品を見てみても、とても私には読めないし。それに、多分だけどこれらは底本(入力の元になる本)の入手も難しいだろうしね。源氏物語にしても現代語訳はたくさん存在するけど、それは当然に訳者の著作権が存在する。原文は研究者とかでない限り読まないわけだから、一般向けの書籍になっているとは思えないし。

そこまで超古典とはいかなくても、ずっと時代が下って明治大正辺りだと、言語としては現代語になるのでだいぶ楽になる。しかし、明治の文学作品は基本的に文語体だからやっぱり言語の素養が必要だし、戦前までは旧字旧仮名だからそれも壁になる。となると、素直に読み下せて入力可能なのは戦後の文学作品となるんだけど、そうなると著作権の切れてない作品がほとんどになってしまう。どうしたもんだろうね。今年が2011年だから、1960年までに亡くなった方の作品は著作権が切れていることになるけれど、終戦が1945年だから戦後に発表されて著作権の切れている作品となると、そう多くはないような気がする。

ちなみに、ウィキソース日本語版には「Wikisource:高木貞治プロジェクト」なんてのがある。「高木貞治」というのは私は名前くらいしか聞いたことがないんだけど、日本を代表する数学者だそうである。で、亡くなったのが1960年なので、著作権が切れたのが今年。で、著書をデータ化しようというプロジェクトが開始されたわけだ。出来れば参加したいところだけど、今度は数学的素養の壁があるから、やっぱり参加できない。ああ、一体私は何ならできるんだぁ。

と、崩れ落ちながら、とぼとぼとウィキソースの旅を続けていたら「私の履歴書」なるものを見つけた。日本経済新聞の最終面に載っている、人物の自叙伝。これのうち、著作権の切れたものを収録していこうという作業が行われてるらしい。この連載が始まったのが1956年だから、著作権の切れている人物もそう多くはなさそうなんだけど、現在収録が行われているのが「浅沼稲次郎」と「吉井勇」。これくらいの分量なら、手始めにちょうどいいんじゃないだろうか。今度図書館に行ったときに、日本経済新聞の縮刷版で探してみるか。ウィキペディアの「私の履歴書」の掲載人物を調べてみると、他に五島慶太、砂田重政、大麻唯男、鳩山一郎、金森徳次郎の分が著作権が切れている模様。

2011年8月24日

jawptool。「Wikipedia:井戸端」の活発度統計処理を組み込もうとするんだけど、意外と手間取ってしまって途中までしか進まなかった。

昨日のウィキソース話の続き。著作権の保護期間は、無記名の場合公表から50年で切れる。ということは1960年までの新聞で無記名記事は全部データ化して公開しても構わないということになる。「プロジェクト:新聞」とか作ってみんなで入力したらどうだろうと思ったけど、現実の作業量を想像して果てた。明治初期から新聞が始まっているとして1960年までで約100年分。しかも、新聞が全国で一体何誌あることか。これが全てデータ化されれば、ウィキペディアをはじめとして、様々なところで便利に活用できるようになるだろうけれど、流石にその手間が現実的ではないかなぁ。

全部の記事ではなくて「私の履歴書」のような有名な連載を入力するのはどうだろうと思って思いついたのが朝日新聞の「天声人語」。あれは無記名だったかペンネームによるものだったと思ったんだけど、調べてみたらペンネームなんだけど中の人が公表されていた。この場合は、その方が亡くなってから50年保護される。ちなみに戦後で1960年までの担当者は嘉治隆一氏と荒垣秀雄氏。どちらも故人だけど、亡くなってから50年は経過していない。

ということで天声人語はまだ無理だけど、同じような発想で他の連載記事で公開可能なものはあるかもしれないから、探してみよう。

2011年8月25日

ウィキブレイク

2011年8月26日

諸般の事情で今日もウィキブレイク。うう、色々やりたいことはあるのにぃ。ああ、データベースダンプも更新されてるよ。

2011年8月27日

ようやくデータベースダンプをダウンロード。8月24日版。

ウィキソースで新聞記事をデータ入力しようと考えているんだけど、全部手で入力するのは大変。よく考えたらスキャナがあるんだからOCRできれば作業が楽になるかも。ということで、試しに手近にあった新聞記事をスキャンしてOCRに掛けてみると、結構な認識率。おお、これはいいかも。だいぶ作業が楽になりそうだ。

週末に旅行に出かけるので、せっかくなので行き先で「Wikipedia:画像提供依頼」に出ているものをチェック。旅行はそれでいいのか、という気がしないでもないが、今回は行き先で余裕のあるスケジュールになっているので、まあ構わんでしょう。

ウィキニュースで、雑草とりを行った記事の査読・公開は可能か質問した件について、それくらいなら構わないという回答をいただいた。大丈夫なんだ。なら、これからは雑草とりもしつつ、査読にも参加しよう。

で、ウィキニュースで査読。2件公開。あと短信。古いニュースだけど誰も書いてなかったのでアップルのスティーブ・ジョブズCEO退任。その他に、ハリケーン「アイリーン」上陸間近と、北朝鮮の6カ国協議復帰へのニュース。

2011年8月28日

旅行で神戸に来ました。午後はフリータイムだったので、写真撮影の旅に。まずは神戸市の住宅地でいくつか写真撮影。これはまあ、だいたい問題なくいった。

次にポートアイランドに移動して、主に企業の本社ビルを撮影。これは注意しないといけないのは、企業ロゴが写り込むと商標権の侵害になる可能性がある。念のためにロゴ入りとロゴ無しの両方を撮っておく。しかし、ロゴが入ってないと、ビルの全景が入らなくて、構図的に残念な写真になってしまうんだよねぇ。

反省点としては、地図を用意してなかったのがバカすぎる。少しでも考えれば分かることなのに。駅に案内地図があるから大体の場所は分かるんだけど、その案内地図を持ち歩けるわけじゃないから、結局近くに行ったら探し回ることになる。だめだめ。ケータイで地図表示させるという方法もあるけど、パケホーダイ契約してないのでパス。次回からは、ちゃんと地図も用意しよう。

ポートライナーで更に移動して、京コンピュータ前駅で下車。こんな駅名に変わったんだね。思えば、私がウィキニュースで初めて投稿した短信が「」の世界一の記事だった。感慨深い。ということで、京の入っている理研の建物をパシャ。

2011年8月29日

だらだらっと画像提供依頼を眺めていたら、「モバイルギア」なんてのを見つけた。以前持ってたんだけどなぁ。今でも手元にあれば写真を取って提供するんだけど、ヤフオクで処分してしまったんだよなぁ。残念。

ちなみにモバイルギアというのは、NECが10年位前に出していたPDA。ペンモデルもあるけどキーボードモデルが中心。このキーボードがPDAにしてはまともだったため、テキスト入力用途で一部に人気だった(要出典)。私も一時期愛用していて、ツーリングレポートとかは全部モバイルギアで書いてた。と、愛用していたんだけどさすがに10年前の機械では現代では役に立たないということで処分してしまったというわけ。ツーリングにも行ってないしね。

と思ったけど、よくよく考えるとヤフオクで出品時に写真を撮ってる。もしかしてHDDにまだ残ってるかもと思って探してみたら、あった!おおー、よく保存してた>自分。ただ、ヤフオク用の写真だから、箱とか付属品とかも一緒に写してて、ウィキメディアに提供するにはちょっといまいち。でも、1枚だけいい感じのがあったので、これを提供しようか。

ただ、自分が撮った写真だったら何でもかんでも提供できるというわけではない。写っている物の著作権とか肖像権とか商標権とかを侵害してないかが問題になる。今回の場合、人物ではないから肖像権は問題なし。著作物でもないから著作権も問題なし。しかし、NECのロゴは写っているから商標権が問題になるかもしれないけど、これについてはコモンズのFAQに単純なロゴなら商標権の侵害には当たらないとあったので多分問題なし。

あと、動作状態を確認するために起動した状態で写しているんだけど、そうするとWindows CEのロゴとかが問題になるかと思ったら、FAQによるとスクリーンショットは問題ないらしい。そのFAQは英文なんで詳細はまだ読んでないんだけど、問題ないならいいか。

というところまで調べたところで、今日は果てておしまい。アップロードは明日にしよう。

2011年8月30日

いい加減管理者業務も手をつけなきゃいかんよな。いつまでもやらないから習熟しなくて、だから手出しできないという悪循環。ということで、削除依頼に手をつけることにする。なんで削除依頼かというと、削除依頼の議論は今までにわりと目を通していて比較的事情が分かるから。

手始めとしては、移動によるノートの残骸に対する即時削除辺りがいいかなぁと思うんだけど、そうそう手ごろな案件が依頼に出ているものでもない。仕方が無いので、リダイレクトの削除依頼で議論の5日間を経過していて、削除票のみが複数入っているものとして「あいたい」を削除することにする。

念のために、再度「リダイレクトの削除の方針」を確認。特に問題なし。記事の履歴確認。全部リダイレクトのみ。リンク元確認。有意なリンク元無し。なら削除して問題なし。ということで、削除実行しよう。ドキドキするな。

で、削除じっこーー。削除した。あとは、依頼ページに削除報告をして作業完了。とりあえず今日はこの1件でおしまいにしよう。まだ削除できそうな案件はあるけど、いきなりたくさんやって何かあっても困るし。少しずつ、徐々に慣れていきましょう。

昨日のモバイルギアの画像。いよいよアップロードする。しかし、ファイルをアップロードするのは初めてなので、これまた緊張するな。ライセンスは本人撮影によるパブリックドメインにした。で、アップロード。ぜいぜい。

これで終わりではなくて、画像提供依頼した人にお知らせしなきゃいけない。「モバイルギア」を直接編集してしまっても問題はないんだろうけれど、依頼として出ているからには、依頼者の希望に沿うほうがいいでしょう。で、この場合は「Wikipedia:画像提供依頼」に報告すればいいわけだな。ということで報告して完了。あんまりいい写真じゃなかったから、喜ばれないだろうけれど、無いよりはいいと思うんで。

久しぶりのウィキニュース短信。この間に、日本は民主党の代表が選ばれたんだけど、それはもう他の人が書いているので私は別のネタを。ニュースサイトを巡回して、ハリケーン・アイリーンの被害の続報と、クモが鳥を食べる様子が撮影されたという脇ニュース。

カテゴリ無しと孤立したページの作業。カテゴリ無しでは恒例のように学校記事に対する在校生と見られる荒らし編集がある。こういう人たちって、カテゴリ指定がなんなのか分かんなくてざっくり除去してしまうから、カテゴリ無し一覧に出てきてしまうのよねぇ。で、見つけた案件は、校歌の転載と、出身が公表されてない著名人の氏名。B-1(著作権侵害)及びB-2(プライバシー侵害)案件として版指定削除依頼を提出。

野田氏が正式に首相に選出されたので短信に追加。

さっき提出した削除依頼のB-2の版指定が間違っていたと指摘を受ける。うわ、だめじゃん。更に、この場合は緊急指定も必要だった。だめだめ。凹むなぁ。にもかかわらず、管理者さんには適切に対処していただけて大変ありがたい。いや、私も管理者なんだけど。凹むなぁ。

思うに、この件って本来ならB-2は私が緊急削除するべきだったんだよなぁ。管理者なんだから。管理者じゃなかったら、今回の対応であっていたとは思うけど(依頼ミスはダメだけど)。管理者のみなさんの負担を少しでも軽くするために立候補して信任してもらったのに、負担を増やしてどうするよって話だよな。まあ、まだ駆け出しの見習いなんだけど。

更に短信。300系新幹線が来年で引退のニュース。本当は短信は1日に何十本も投稿されて、記事執筆の導線になるのが望ましいんじゃないかなぁ。現状の多くても日に数本というのは、ちょっと少ないのかもしれない。あと、査読を1件。疑問点があったのでノートに記載。

ちょっと思い立って、7月8月のウィキニュースの記事の情報源が現時点でどれだけリンク切れになっているかを調べてみた。なかなか面白い結果になったようなんだけど、調べるのだけで疲れたので集計するのはまた明日に。

今日、リダイレクトを1件削除したんだけど、ふと疑問に思った。現在、リダイレクトの削除依頼が提出されると、リダイレクト先のページに削除依頼告知のテンプレートがボットによって貼られることになっている。これは誰が剥がすんだろう。もしかして、削除した管理者?と思って既に削除済みの履歴を追ってみると、終了して削除依頼ページから除去されるとボットが剥がしてくれるようだ。よかった。特にこれについては何もする必要はないわけね。

2011年8月31日

1日1削除?。ということで、削除依頼でいい案件がないか探すんだけど、なかなか無い。理想は、7日の議論期間が過ぎて、削除票のみが多数入って削除の合意が成立しているもの。

が、そういう分かり易い案件は既に他の管理者の方が処理してしまっておられるので、残ってない。1件だけ該当するのがあったんだけど、複数のテンプレートを同時に提出した案件だったんで、これは影響範囲の大きさからももう少し時間を置いたほうが安全だろうと判断して保留。複数同時案件というのも、初心者管理者にはハードル高いしね。

昨日、データ採取したウィキニュースのメディア別の情報源採用数と残存率。集計してみたら、こんなんになった。

2011年7月の情報源採用数と2011年8月30日時点での残存率

紙名 採用数 残存率
読売新聞 24 13%
朝日新聞 21 81%
47NEWS 15 100%
毎日新聞 13 8%
産経新聞 8 100%
日刊スポーツ 6 100%
時事通信 5 100%
スポニチ 3 100%
広島・中国新聞 2 100%
デイリースポーツ 2 100%
サンケイスポーツ 1 100%
ロイター 1 100%
沖縄タイムス 1 100%
西日本スポーツ 1 100%
J-CASTニュース 1 100%
産経関西 1 100%
陸奥新報 1 100%
スポーツ報知 1 0%
河北新報 1 0%

2011年8月の情報源採用数と2011年8月30日時点での残存率

紙名 採用数 残存率
毎日新聞 19 84%
読売新聞 18 72%
朝日新聞 14 100%
47NEWS 8 100%
産経新聞 8 100%
時事通信 6 100%
日本経済新聞 5 40%
日刊スポーツ 4 100%
Iza 2 100%
ロイター 2 100%
静岡新聞 2 100%
ZAKZAK 1 100%
サンケイスポーツ 1 100%
スポニチ 1 100%
沖縄タイムス 1 100%
岩手日報 1 100%
京都新聞 1 100%
新潟日報 1 100%
大阪報知 1 100%
朝鮮日報 1 100%
東亜日報 1 100%
東京新聞 1 100%
夕刊フジ 1 100%
聯合ニュース 1 100%
スポーツ報知 1 0%
中日新聞 1 0%

特に意味はないんだけど、新聞系サイトのみを抽出していてテレビ系サイトは集計してない。なんとなくテレビ系は全部消えてそうだからカウントする意味無いかなと思って。

単純な感想としては、やっぱり三大紙は強いなというところ。採用数が他とは大きく違う。実際、私も巡回するニュースサイトはこの三大紙が中心だしねぇ。ブランドの力は強いってことですかね。

ただ、ずっと残るウィキメディアの情報源としては、すぐに記事が消えないというのも重視したい点。この点では三大紙でも読売と毎日はほぼ期待できない。朝日は全部残すと聞いたことがあったような気がするけど、実際には消えていくものもあるのね。ある程度採用数があって残存率が100%なのは47NEWSと産経新聞。これからは、情報源としてはこの二つを中心にするのがいいかねぇ。ただ、47NEWSについては、複数メディアの集合サイトなので、提供メディアによって消える消えないということが起こる可能性もあるかも。今回47NEWSでまとめてしまって提供メディアは抽出しなかったので、その点は注意が必要かな。抽出してるときには共同通信が多かったような気がするから、47NEWSの共同通信なら、多分大丈夫なんじゃないかと思うけど。

何気に「最近の更新」を眺めていたら、荒らし投稿を発見。しかも即時削除タグも貼ってくれているので、削除することにする。履歴も確認したけど、初版から荒らしだから問題なし。ということで、ざくっと削除。今日のノルマ達成。

荒らしの投稿者はIPユーザなんだけど、そっちの対処はどうしようかなぁと思っていたら、他の管理者の方が一週間ブロックかつ会話ページに案内を貼ってらした。す、素早い。かつ適切。うーん、私もこのレベルになれるのかなぁ。ならなきゃ、管理者になった意味がないんだけど。

ああ、そういえば今日は8月31日。夏休みも終わりかぁ。学生さんたちの荒らしも、今日でおさまるのかなぁ。

ウィキニュース短信。スリランカの非常事態令が解除されたニュースと、台風12号が日本本土に接近のニュース。どちらも情報源は47NEWSの共同通信にしてみた。

IRCで即時削除した記事について、要約欄の秘匿がなされてないという指摘を受ける。うが、そうだった。これもミスだなぁ。いや、普通の削除なら別にいいんだけど、今回は一般人の氏名が初版から記載されていたので、要約欄にもそれが出ていたから秘匿する必要があったわけだ。いかんなぁ。一つ何かをするたびに、一つ何かをミスしているような気がする。まあ、そうやってミスして指摘してもらって学習していくんだろうけれど。問題があるとしたら、いつまでも学習しないことだろうな。もちろん、最初からミスしないのが理想だろうけれど。しかし、凹むなぁ。あ、でも昨日のリダイレクトの削除については今のところ指摘は入ってないから、問題はなかったと思われる。一応、全てでミスをしているわけではないということで。

なかなか大変なので手をつけてなかった神戸で撮影した画像の処理。ようやく手をつける。舐めてかかってたけど、しかしこれって結構大変だね。まず1箇所につき複数枚撮影しているものは、そのなかからベストショットを選択。斜めになっている場合があるから回転して余分なところをトリミング。色調もおかしいのは補正を掛ける。そこまでだけでも結構疲れる。

次にアップロードの準備としてファイル名を付けていく。コモンズは言語別に分かれてなくて英語が基本となるからファイル名も英語になる。ちゃんとユニークになって、意味も分かるようなファイル名を付けていくのは、それはそれで大変。ま、基本は近しいカテゴリのファイルのネーミングを真似させてもらうんだけどね。

ここまでできたら、いよいよコモンズにアップロード。アップしてライセンス選択して説明つけてカテゴリ付けて。で、このカテゴリ付けてってのが結構難しい。カテゴリ名ももちろん英語だから、どんなカテゴリがあるのか一覧表示しても、日本語よりは視認性が劣るので探すだけで一苦労。あと、コモンズにはまだ慣れてないから、カテゴリ構成が大まかにどうなっているかというのも把握できてないし。結局これも近しいファイルを探してそのカテゴリを真似させてもらうんだけど。

そうして、ようやくアップロード完了。今回アップしたのは合計16枚。たったこれだけでも、これだけ大変なんだから、あんまりまとめて写真を撮ってくるというのはやめとこう。少しずつやっていったほうがいい。その内慣れてくれば少しは手早くなるだろうし。

アップロードした画像をチェックしていたら、ライセンス欄に「Template loop detected」というエラーメッセージが山盛り出てる。なんだこりゃ。どうしよう。アップロード後にライセンスを変更することは許されてないんだけど、この場合は修正して構わないよなぁ。ということで修正する。ついでに、アップロード時にカテゴリがいまいちだったのを、もう少しまともなのに選択し直す。

全部にさっきのエラーが出てるのかと思ったら、最初にアップロードしたのには出てない。エラーになっている部分のソースは「{{self|self|self|self|self|self|self|self|self|self|self|self|self|self|self|self|own-pd}}」なんてのになってるんだけど、どうやらアップロード後に続けてアップロードをすると「self|」が一つ増えていってるみたい。アップロード・ウィザードのバグだよなぁ、これ。Bugzillaに報告したほうがいいと思うけど、当然英語で報告しなきゃいかん。うう、言語の壁が。。。

明日にしようかと思ったけど、勢いをつけて画像を記事に貼り付けていく作業に取り掛かる。十数ページ完了。ぜいぜい。でも、できてよかった。

その後も画像提供依頼を眺めていたら、色々出てるもんだねぇ。私にもいくつか提供できそうなものがあるかな。それと思ったんだけど、そんなに写真を撮る趣味が無い私でも、なんだかんだといってHDDには結構な量の画像を溜め込んでいる。もちろん自分で撮影したもの。これも、全部調べてみたら使い物になる画像がそれなりにあるんじゃないだろうか。そんなことを考えると、またしてもToDoが一つ増えてしまうな。