読者です 読者をやめる 読者になる 読者になる

「JIS X 0213:2004 対応」の多義性

Windows VistaはJIS X 0213:2004に対応しないらしいを見たり、okuokuさんと話したりして思ったこと。
そもそも、JIS X 0213:2004 ではいくつかのレイヤーを定義している。具体的には以下の通り。

  • 字体
  • Abstract Character Repertoire
  • Coded Character Set (CCS)
  • Character Encoding Form (CEF)
  • Character Encoding Scheme (CES)

字体

まず、字体仕様としての JIS X 0213:2004。
仕様の1.適用範囲に「この企画は,図形文字及びそのビット組み合わせを規定するもので,用途,個々の図形文字の具体的字形設計などは,この企画の適用範囲とはしない。」とあり、6.6.1にも「例示字体は,この規格の面区点位置を実現した一つの例であり,その字体を推奨するものではない。」とある。しかし、2,004改正において表外漢字字体表に対応して字体を変更している点から推測するに、JIS X 0213:2004 では面区点位置に包摂される複数の字体について「字体選択のよりどころ」を示している、つまり、例示字体を推奨していることは明らかであろう。(字形については2004改定でも規定されていないと解釈する)
つまり、JIS X 0213:2004 では漢字集合 (のうちの漢字) に対して字体を規定している。

Abstract Character Repertoire

JIS X 0208 とあわせて、11233文字 (JIS X 0213:2000 は 11223文字) の漢字集合を規定している。

Coded Character Set (CCS)

定めた図形文字それぞれに数値 (面区点位置) を対応させている

Character Encoding Form (CEF)

それぞれの面区点位置にビット組合せ (7 ビット 及び 8 ビットの 2 バイト符号) を対応させている

Character Encoding Scheme (CES)

Shift_JIS-2004、ISO-2022-JP-2004、EUC-JIS-2004 の三つの符号化表現を規定している。 (参考)

備考

JIS X 0213 はもっぱら文字集合 (Unicode における部分集合) として扱われることが予想されるが、JIS X 0213:2004 における包摂規準と、Unicode における包摂規準は異なることに注意する必要があるかもしれない。