読者です 読者をやめる 読者になる 読者になる

JIS2004と「字形の変更」

Char

.mjtさんのところで見かけた2004 JIS をめぐる混乱を読んで、頭痛がした。
日本語の文字コードは未だにこんな連中に弄ばれているのか・・・。


> 「区鳥」と「區鳥」とでは、大きく字形が異なる
文脈を読めば、同じ文字だから両方正しい。
規格に準じれば、「区鳥(U+9D0E)」と「區鳥(U+9DD7)」は別の code point を与えられているので別の文字。


> 文字コードの規格を決めるのは、理系の人々である。そのせいで、1983年のJIS改定では・・・
83JISの中心人物は野村雅昭だったはずだが、彼は文系だぞ・・・。


結局のところ、南堂は野村雅昭のベクトルを逆にしただけって感じがする。
だから文系のバカなんぞに規格を触らせちゃいけないと・・・
(などと大声で言えるのは文系の権利だ ;)


とかはほどほどにして、確認、JIS2004は83JISとは違います。
83JISは略字体と正字体を交換しましたけれど、JIS2004で変更されたのは‘例示字体’です。
(「字形を変更した」という文句に騙されちゃいけません)
略字体がJISから‘消えた’わけでも無いし、正字体が‘追加’されたわけでもありません。
(彼は「字形の変更」という造語を用いる事で、そう思わせようとしているわけですが)


旧来のJISでもJIS2004でも、「葛(U+845B)」は、「葛飾」の「葛」と「葛城」の「葛」の重ね合わせです。
どちらかを選べても、もともとどちらを意図されているのか分からないので、無意味でしょう。


両方を選べるようにする(=区別できるようにする)には、別のコードポイントに略字体と正字体を別に収録するか、枝版方式を使うかしないと。この手の問題に詳しい方は枝版方式を推すことが多いように感じます。
例えば、「葛飾」の「葛」はU+845B-1、「葛城」の「葛」はU+845B-2というように。
なお、わたしの意見は保留しておきます。


とりあえず指摘しておくと、旧来のJISとJIS2004、両者を収録し、選べるようにしてもこの問題に対しては無意味ですよ。