Re: Eric Muller からの提案

なーるほど! it makes sense. 下農さんありがとう。

> 2020/10/29 21:25、Atsushi Shimono (W3C Team) <atsushi@w3.org>のメール:
> 
>> On 2020/10/29 20:44, 木田泰夫 wrote:
>> GCO のクラスはマークアップによって明示的に指定することもできます、が、多くの場合はその GCO を構成する Unicode 文字からクラスを決定します(その場合、同じ GCO はどれも同じクラスとなります)。そしてそのクラスはその GCO を構成する Unicode 文字にアサインされたクラスにより決定することができます。通常は GCO のベース Unicode 文字のクラスがその GCO のクラスです。しかし、その他の文字がクラスを乗っ取ることもあります。例えば:<U+00A0 NO-BREAK SPACE> は一つのクラスで <U+00A0 U+0301 COMBINING ACUTE> は別のクラスかもしれません(木田:ここ、意味がわからなかったので、Eric に聞きます)。
> 
>  GCOは例えばÀ (U+00C0)だとU+0041 U+0300としても表記できて2文字が一つのGCOになりますが、この
> 場合はU+0041とU+00C0の文字のクラスは(ほぼ)同じなので、U+0041とU+0041 U+0300はU+0300がついても
> ベースとなるU+0041の文字のクラスのまま変わりません。
> # EAWとか違うのもあるはずなので仮定としておいてください、、、
>  が、U+00A0の場合、NBSPとしての場合と、後ろにU+0301の文字がついて' ́'だけが表示される状態に
> なった場合はGCOは空白としては扱わなくなるので、ベースUnicode文字のクラスがGCOのものと同じにな
> るとは限らないよ。
> 
>  ・・・という話かと思います。
> 
> # 例示が難しいですよねこれ。。
> 
> 
>> ========
>> カラムの説明:
>> 1. コードポイント
>> 2. UAX50の縦書きプロパティ
>> 3. 横書きクラス
>>      * H ならカラム 5 に書いてあるクラス
>>      * ブランクなら漢字(と同じ扱い)
>> 4. 縦書きクラス
>>      * V ならカラム 5 に書いてあるクラス
>>      * ブランクなら漢字(と同じ扱い)
>> 5. クラス
>> 6. A と書いてあれば、もしこのテキストのスクリプトが中国語か日本語(Hans, Hant, Jpan)でないなら、クラスは westernChar
> 
>  木田さんのメールのテキスト側には番号が振ってない(htmlメール側でliでリストされてる)ので一応
> 番号付きで引用しておきます。
> <OpenPGP_0x72397AFC0905265D.asc>

Received on Thursday, 29 October 2020 13:10:27 UTC