Re: Meeting notes 2020·12·01

みなさま、
小林龍生です。

  > 1. 今日の一番大きなポイントはおそらく、JLReq の示しているコードポイント、ひいては JIS X 0213 & Unicode
の合意によるアサインメントにはてなマークをつけた、つまりお国に反旗を翻したことでしょう。ハイフン類、三点リーダ、クオーテーションなどにおいて、お互いに似た和文、欧文の約物が統合されているのだけれど、グリフの設計が異なるだけではなくて、振る舞いが異なるということです。「プロポーショナルな文字に欧文空白を組み合わせて全角っぽくするのは間違ってる!」という小林さんの叫びも聞こえてきました。

このポイント、今後のJLreq-TFの進む方向と深く関わると思うので、一言。
ぼくの琴線(コトセンではなくってね)に触れたのは、木田さんの「つまりお国に反旗を翻したことでしょう
」という部分。先日の議論の最中には、ぼくには、全くそのような《お国》みたいな意識はなかったのでね。
ただ、JISとUCSとの対応付けについては、どうもいろいろ問題がありそうだなあ、という気はしていました。
オリジナルのJLreqのクラス分けの、特にUCSとの対応付けに係わる部分は、以前マイクロソフトに在籍していた阿南さんが付けてくださったものなのですが、阿南さんは、JIX
X0213の2004年の改正(例の2000年版の恣意的なUCSとの対応付け問題の解消)でも、中心的な役割を担ってくださって、符号位置の対応関係を整理したエクセルの表も阿南さんが管理してくださっていました。
今回、ぼくが、木田さんと敏さんの表に追加した面区点位置も阿南さんのデータがベースになっています。
一方の、JIS X0213の方は、UCSとの対応付けが、じつは、よく分からない。シフトJISで実装されていたしね。
白状すると、今回のJIS X0208の区点位置とUCSとの対応付けも、まあ、いいかげんなやっつけ仕事で。
ネットで検索して、
https://www.asahi-net.or.jp/~ax2s-kmtn/ref/jisx0208.html

というページを見つけて、後処理が簡単そうだったので。
そのままコピペでエクセルに取り込み、csvで吐き出して(この時点でUTF-8になっている)、pythonでUCSの符号位置に変換しただけ。
というわけで、すくなくとも、JIS X 0208に関しては、《お国》は、UCSとの対応関係みたいなことは、いっさい係わっていないわけですね。
まあ、JIS X2013は、規格そのものにJIS X0208をそのまま包含しているので、JIS X 0208のUCS対応も、JIS
X0213の部分集合と考えて、2004年版以降の対応付けに従えばいいか、とも考えられます。
阿南さんの対応付けは、まさに、そのような観点でなされたものではないかと。

ところが、今回、敏さん・木田さんテーブルとJISとの対応付けを試みてみて、抑えきれない妄想が湧き上がってきたのですね。
すなわち、(いまでも引きずっている)シフトJIS的環境(もしくは指に染みついた慣習)による非漢字の運用と、JIS
X0213の非漢字全体を対象とした非漢字の運用との間に、何とも表現しがたい深淵が潜んでいるのではないか、という。
前回のミーティングで、ぼくが提起した問題を、ぼくなりに敷衍すると、以上のようなことになります。

もう一点。《お国》問題。
これも、ちょっと、考えてみると、木田さんとぼくの立場(や経歴)の相違が浮かび上がってきて、何だか面白くってね。
木田さんが、《お国》という言葉で表現しているのは、多分、JIS
X0213のUCSとの対応付けそのものなわけで。実体は、芝野委員長の下で、おそらくは阿南さんを含む実務家が、当時のシフトJISの実装を踏まえた上で、当時の状況に対してそれなりに批判的建設的な立場で、作り上げたものではないか、と。規格票に記載されている原案作成委員会の名簿を見ても、面識のある方が何人かおられて、それぞれ、一家言ある人たちなのでね。
それに対して、アップルのグローバルな文字・言語対応戦略の中に、日本語の係わる個別機能を組み込むために奮戦しておられた木田さんは、社内的には、「だってJISに書いてあるんだもん」とか言って、日本語関係の要件を押し込んでいた。いえ、これ、ぼくの勝手な妄想ですが。
とは言いつつ、木田さんも、薄々とか、明確にかは、さておき、どうも、JISにも怪しいところがありそうだ、とは気付いておられた。これも、ぼくの妄想。
で、そのようなコンプレックス(精神的な複合、劣等感ではなくってね)が、《お国》という言葉で現れたのかなあ、と。ここまで、ぼくの妄想。

というわけで、最初のJLreq-TFの進む方向、に戻りますね。
JLreq-TFとして、最初の段階は、問題点の抽出。⇐いまはここ。検討すべき問題圏は、以下。
・現状のJIS X0213の非漢字を中心とする文字レパートリーのUCS符号位置実装環境による運用には、いろいろな問題がある。
・JIS X0213レバートリーで十分か/余分なものはないか
・JIS X0213レパートリーとUCSとの対応関係は順当か
・現在同一視されている非漢字グリフで、文脈もしくは目的によって、機能的に異なる振る舞いをすべきものが含まれていないか
で、これらの検討結果を踏まえて、日本語環境における非漢字の扱いは、このようにあるべきである、という提言にまとめるのが第2段階。
で、その先に、その提言を、どのような主体が、どのような形で実現するか、という課題があるわけですね。

最初にぼくの琴線に触れた「つまりお国に反旗を翻したことでしょう」という木田さんの言葉。ぼく的には《お国》などという発想は、端からなくって、今まで溜まりに溜まってきた、標準規格と実装・運用のズレを、何とかなくしたいなあ、という。
因みに、1983年から始まった、「新旧JIS問題」は、人名漢字の扱い問題への戦線拡大もあって、規格面での整理がぼ完了するまで、40年かかりましたけど。で、実装・運用面での実現は、まさに、これから。ぼくが生きている間に、実現するかなあ。

Received on Wednesday, 2 December 2020 22:12:55 UTC