Re: Eric Muller からの提案

On 2020/10/29 20:44, 木田泰夫 wrote:
> GCO のクラスはマークアップによって明示的に指定することもできます、が、多くの場合はその GCO を構成する Unicode 文字からクラスを決定します(その場合、同じ GCO はどれも同じクラスとなります)。そしてそのクラスはその GCO を構成する Unicode 文字にアサインされたクラスにより決定することができます。通常は GCO のベース Unicode 文字のクラスがその GCO のクラスです。しかし、その他の文字がクラスを乗っ取ることもあります。例えば:<U+00A0 NO-BREAK SPACE> は一つのクラスで <U+00A0 U+0301 COMBINING ACUTE> は別のクラスかもしれません(木田:ここ、意味がわからなかったので、Eric に聞きます)。

 GCOは例えばÀ (U+00C0)だとU+0041 U+0300としても表記できて2文字が一つのGCOになりますが、この
場合はU+0041とU+00C0の文字のクラスは(ほぼ)同じなので、U+0041とU+0041 U+0300はU+0300がついても
ベースとなるU+0041の文字のクラスのまま変わりません。
# EAWとか違うのもあるはずなので仮定としておいてください、、、
 が、U+00A0の場合、NBSPとしての場合と、後ろにU+0301の文字がついて' ́'だけが表示される状態に
なった場合はGCOは空白としては扱わなくなるので、ベースUnicode文字のクラスがGCOのものと同じにな
るとは限らないよ。

 ・・・という話かと思います。

# 例示が難しいですよねこれ。。


> ========
> 
> カラムの説明:
> 
>  1. コードポイント
>  2. UAX50の縦書きプロパティ
>  3. 横書きクラス
>       * H ならカラム 5 に書いてあるクラス
>       * ブランクなら漢字(と同じ扱い)
>  4. 縦書きクラス
>       * V ならカラム 5 に書いてあるクラス
>       * ブランクなら漢字(と同じ扱い)
>  5. クラス
>  6. A と書いてあれば、もしこのテキストのスクリプトが中国語か日本語(Hans, Hant, Jpan)でないなら、クラスは westernChar

 木田さんのメールのテキスト側には番号が振ってない(htmlメール側でliでリストされてる)ので一応
番号付きで引用しておきます。

Received on Thursday, 29 October 2020 12:25:19 UTC