過去の遺物であるシフトJISは捨てよう

2009/12/15作成

新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能

これ、別にそれでいいじゃんと思ったんだけど。

新常用漢字表が採用されて困る自体ってのは、新規に追加された文字をシフトJISで表そうとしたときだけでしょ。別にいいじゃん。今後新規に作成するデータは全部Unicode(UTF-8)で。それで困ることは特にないでしょ。データ量が増えるっていっても、いまどきのパソコンのメモリとHDD容量を考えると誤差みたいなもんだし。まあ、問題は記事にもあるとおり内部処理をシフトJISに依存してしまっているアプリケーションの改修が必要ってことだけど、これもいずれはしなきゃいけないことだったわけで。2000年問題の時のように、これまでずるずると後回しにしてきたことを、一気にけりをつける外圧が来たと思って諦めるしかないんじゃないでしょうかね。

だいたい、シフトJISとかEUC-JPとかエンコードが複数乱立している状態ってのは健全じゃない。とっととUTF-8に統一しようよ。Unicodeに問題があると言っても、エンコード乱立による問題よりはマシだと思うけどね。とりあえず統一が果たせれば、その次に進むのも楽になるし。

なお、今回の漢字追加が行われても、過去に作成されたシフトJISのデータを修正する必要は一切無いからね。だって、それらのデータには今回追加される文字は使われてないのは明白なんだから。シフトJISで作られた大量のデータ遺産があるというけれど、それについてはUTF-8にコンバートするツールさえ用意できればデータをいじる必要は全然無いということだと思う。


あおやぎのさいと2.0 トドの日記2.0