8月23日

2011/8/23作成

索引の赤リンクについては、除去しても構わないだろうというコメントがあった。なら大丈夫かな。と言っても件数が多いのでそう簡単にはいかないけど、ぼちぼち作業をしていこう。

代理で統合提案をしていた「アルファ (ミュージシャン)」は反対票がなかったので統合を実施。しかし、メンバー3人の記事を統合するので、ボリュームがあって結構大変。それでもなんとか統合作業完了。ToDoが一つ果たせてよかった。

そういえばすっかり忘れていたけど、孤立したページとカテゴリ無しのページ。それぞれ作業する。なんか久しぶりだな。この日記を読み返してみたら、前回は17日だから一週間ぶりか。更新を1回飛ばしたことになるな。

jawptool。記事名一覧の出力に、これまではData::Dumperというモジュールを使っていたんだけど、これをやめて自力で行うように変更。なんでData::Dumperを使わないようにしたかというと、理由は二つ。一つはData::DumperではUTF-8文字がエスケープされるのでファイルサイズが大きくなること。もう一つはData::Dumperは一旦出力用の文字列を作るんだけど、配列やハッシュが巨大だとこの文字列も巨大になってメモリを消費する。ということで修正。ついでと言ってはなんだけど、名前空間毎にファイルを分けるように変更した。これで、後で扱い易くなるかな、と。

ウィキペディア、ウィキニュースときて、次は「ウィキソース」に参加してみたいなと思ってる。と言っても、その辺で打ち止めで、それ以外のプロジェクトには多分参加は難しいと思ってるんだけど。「コモンズ」に画像を投稿するというのはあるかもしれないけど。

コモンズというのは、ウィキメディアプロジェクト全体に対してメディアファイルを提供するところ。昔は画像や音楽ファイルなどを各プロジェクト毎に保有していたそうなんだけど、そうすると重複して無駄になったり、あっちのプロジェクトにあるファイルがこっちのプロジェクトには無くて使えないなんてことが起こる。ということで、メディアファイルを集約するプロジェクトとしてコモンズが立ち上がったということらしい。なので、新規にメディアファイルを提供する場合は、各プロジェクトに対してではなく、コモンズに提供することが推奨されている。

で、話は戻ってウィキソース。著作権の縛りの無い文書の原本を投稿するわけだけど、何を投稿するか。とっつき易いのは、やっぱり文学作品だろうね。ただ、これには言語の素養の壁がある。源氏物語とかの古典作品だと、そもそも原文を読むのに古典の素養が必要になる。実際、いくつかのウィキソースに投稿されている古典作品を見てみても、とても私には読めないし。それに、多分だけどこれらは底本(入力の元になる本)の入手も難しいだろうしね。源氏物語にしても現代語訳はたくさん存在するけど、それは当然に訳者の著作権が存在する。原文は研究者とかでない限り読まないわけだから、一般向けの書籍になっているとは思えないし。

そこまで超古典とはいかなくても、ずっと時代が下って明治大正辺りだと、言語としては現代語になるのでだいぶ楽になる。しかし、明治の文学作品は基本的に文語体だからやっぱり言語の素養が必要だし、戦前までは旧字旧仮名だからそれも壁になる。となると、素直に読み下せて入力可能なのは戦後の文学作品となるんだけど、そうなると著作権の切れてない作品がほとんどになってしまう。どうしたもんだろうね。今年が2011年だから、1960年までに亡くなった方の作品は著作権が切れていることになるけれど、終戦が1945年だから戦後に発表されて著作権の切れている作品となると、そう多くはないような気がする。

ちなみに、ウィキソース日本語版には「Wikisource:高木貞治プロジェクト」なんてのがある。「高木貞治」というのは私は名前くらいしか聞いたことがないんだけど、日本を代表する数学者だそうである。で、亡くなったのが1960年なので、著作権が切れたのが今年。で、著書をデータ化しようというプロジェクトが開始されたわけだ。出来れば参加したいところだけど、今度は数学的素養の壁があるから、やっぱり参加できない。ああ、一体私は何ならできるんだぁ。

と、崩れ落ちながら、とぼとぼとウィキソースの旅を続けていたら「私の履歴書」なるものを見つけた。日本経済新聞の最終面に載っている、人物の自叙伝。これのうち、著作権の切れたものを収録していこうという作業が行われてるらしい。この連載が始まったのが1956年だから、著作権の切れている人物もそう多くはなさそうなんだけど、現在収録が行われているのが「浅沼稲次郎」と「吉井勇」。これくらいの分量なら、手始めにちょうどいいんじゃないだろうか。今度図書館に行ったときに、日本経済新聞の縮刷版で探してみるか。ウィキペディアの「私の履歴書」の掲載人物を調べてみると、他に五島慶太、砂田重政、大麻唯男、鳩山一郎、金森徳次郎の分が著作権が切れている模様。


あおやぎのさいと2.0 新人うぃきめでぃあん日記