GB2312とGB18030

20日前くらいに中国から来たメールで、文字化けしていたメールがあったんですが、GB18030というエンコードを指定したら読めました。そこに出てきた文字は日本語でした。中国語のエンコーディングで、なぜ日本語が?と思って少し調べてみると

GB18030とはGB2312との上位互換規格で、更に拡張漢字を含むUnicodeの文字セットを完全に収録した規格

とのこと。なるほどUnicodeの規格が入ってたからか。Javaも対応してますね。一昨年はGB2312が主流だと説明を受けて、日本語・英語・中国語のサイトを構築しましたけど、今の主流のエンコードは?と聞くとどうなるんですかねー。オフショア開発やってても、みんな日本語のOS使ってるから、中国のエンコード使わないんですよね(^_^;