Re: Meeting notes 2020·12·01


>> ・文字の追加がらみで:漫画などで膨大な使用実績のある、母音に濁音、を日本語文字セットに加えるべきではと思っています。コードポイントは既にありますから(合成の濁音をつけるだけ)、後は誰かが日本語の文字セットとしてこれもあるよ、ということを何らかの形で権威づけて示すだけでしょうかね。

>  包摂基準でもIVSでもないですが、、結合文字として表現できる&近年新しく開発(?)された文字を追加するってどうなんだろう?という疑問がずっとふつふつとあるんですよね。。


はい、これらの文字は Unicode 的には既に「ある」んです。表現できます。あとは、フォントや入力など、この文字を環境超えて共通で使えるようにする必要があります。その環境を整えるために「これが日本語の表現に必要な文字のセットだよ」という JIS なりデファクトなりの規格が必要ではないかという意味です。

従来は JIS X 0208 なり 0213 なりの文字コード規格がその役目も持っていました。文字コードを決めるという役割はもはや Unicode に譲るとしても、依然として文字セット規格は欲しいなと。

木田

> 2020/12/03 14:13、Atsushi Shimono (W3C Team) <atsushi@w3.org>のメール:
> 
> 
> 
>> On 2020/12/01 16:32, 木田泰夫 wrote:
>> ・文字の追加がらみで:漫画などで膨大な使用実績のある、母音に濁音、を日本語文字セットに加えるべきではと思っています。コードポイントは既にありますから(合成の濁音をつけるだけ)、後は誰かが日本語の文字セットとしてこれもあるよ、ということを何らかの形で権威づけて示すだけでしょうかね。
> 
>  包摂基準でもIVSでもないですが、、結合文字として表現できる&近年新しく開発(?)された文字を追加するっ
> てどうなんだろう?という疑問がずっとふつふつとあるんですよね。。似たようなものがCJKの包摂の時の大激論
> でもあったりしたのでしょうけれど、、というか、ハングルブロック・・・?
>  日本語文字セットという文脈がそういう文脈なのか、もしくはこないだ出たGCO的な文脈の文字クラスなのか、
> というのが微妙に把握できませんでしたが、もし後者であれば濁点は結合文字なので2つあわせてGCOとして日本
> 語かなの文字クラスになるんじゃないでしょうか。
> 
> 
>> ・文字を加えるのは良いとして、利用者がそれを使って便利になって幸せになる筋道が必要ですね。反対にそれなしに文字を加えても肥やしを増やすだけでしょう。入力はどうするか、エンジンはどう振る舞うか、その文字を含んだフォントと含まないフォントの混在環境、など複雑な問題になりそうです。
> 
>  そういえば、2つ合わせた倍角文字でunicodeに突っ込めたとして、、、ですが、表示系とかはてまたもしや
> OpenTypeもいじらんとダメ?だったりするのでしょうか・・・?

Received on Thursday, 3 December 2020 05:32:08 UTC