- From: Kobayashi Toshi <binn@k.email.ne.jp>
- Date: Sun, 02 Jun 2024 09:21:20 +0900
- To: JLReq TF 日本語 <public-i18n-japanese@w3.org>
木田泰夫 様 みなさま 小林 敏 です. 木田泰夫 さんwrote >なるほど。おっしゃる通り、例えばjlreq-dの表記をJIS X 0213:2004や表外漢字字体表に合わせると決めた場合、繫 vs 繋のようにコードポイントが異なるゆえに注意すべき漢字がありますね。 繫 vs 繋の問題は,実は活版時代にもあったのですが,実は問題となる字は多くありませんでした.添付した画像は,“広辞苑”の第1版の最後に掲げられている表です.“広辞苑”の第1版のかなり組版作業が進んだ段階で,この問題に気付いたのですが,手遅れということで,最後に言い訳したのです(第2版では,こうした字形は使用していない).(活版時代の問題は,添付データの字種に限られるわけではないが,それに追加される字は,それほど多くはないでしょう.“校正必携”のだいぶ前の版にも,こうした字の例は掲げられていたが,たしか1ページだったように記憶している.) それがJIS X 0208の改定などの影響で問題となる漢字が増えていった事情があり,それへの対応として“表外漢字字体表”や,その後の“常用漢字表”の改定などで,こうした問題への考え方が,ある意味で定まったわけです.ただ,この2つの表を正確に理解しているかどうかは別問題で,デジタルテキストを扱う人が,この2つの規準をどうの程度理解しているかは,かなり疑わしいと私は思っています. そして,仮に“表外漢字字体表”と“常用漢字表”の表に示されている字体を表現しようとした場合,Unicodeの範囲では完全に処理できず,IVSの機能を利用しないと実現できないということです.(ただし,問題を“表外漢字字体表”と“常用漢字表”の表に示されている字体を表現しようということに限ります.それ以外にも,いろんな異体字の問題はあります.) 前のメールに書いた異体字の区別の分類は,やや詳しくすると以下のようになります. 1 シフトJISでも区別できる 2 Unicodeを利用すると区別できる 3 Unicodeで区別できないが,IVSを利用すると区別できる(デザイン差ではない場合) 4 Unicodeで区別できないが,IVSを利用すると区別できる(デザイン差) 5 Unicodeで区別できなく,IVSを利用しても区別できない(主にデザイン差と考えられる) 2で全て解決できれば,山本さんの言う通りになります.4以下は,やりたい人がやればいいことで(その実現の方法を紹介するのはいいことですが),“表外漢字字体表”と“常用漢字表”の考えに従えば,問題から除外してもよいでしょう. いってみれば3が問題です. 例を出すと, 2で解決できる例 摑・掴 噓・嘘 繫・繋 2で解決できないが,3で解決できる例 溺 賭 剥 *私が見ているデータ(フォント)では,“溺”と“賭”は,“表外漢字字体表”で示されている字形,“剥”はそうでない. DTP等でIVSが利用できる場合は,3や4も利用できますから,基本的に“表外漢字字体表”と“常用漢字表”の表に示されている字体を表現できます. ただ,一部で細かい字形の差異を問題にする場合にIVSでは実現できません(これは変更できることだと思いますが,現状ではということです).ただ,その問題の多くは,“表外漢字字体表”や“常用漢字表”でいう“デザイン差”の問題です(“表外漢字字体表”と“常用漢字表”では“デザイン差”の扱いはやや異なります). こうした事情を説明するには,そうなった事情もいくらか説明しないといけないし,“表外漢字字体表”と“常用漢字表”の考え方を正確に紹介しないといけない(これがけっこう大変). ですので,問題は指摘したいが,それをjlreq-dに入れるのは,ちょっと躊躇しています.
Received on Sunday, 2 June 2024 00:23:47 UTC