- From: 木田泰夫 <kida@mac.com>
- Date: Thu, 29 Oct 2020 22:10:09 +0900
- To: "Atsushi Shimono (W3C Team)" <atsushi@w3.org>
- Cc: public-i18n-japanese@w3.org
なーるほど! it makes sense. 下農さんありがとう。 > 2020/10/29 21:25、Atsushi Shimono (W3C Team) <atsushi@w3.org>のメール: > >> On 2020/10/29 20:44, 木田泰夫 wrote: >> GCO のクラスはマークアップによって明示的に指定することもできます、が、多くの場合はその GCO を構成する Unicode 文字からクラスを決定します(その場合、同じ GCO はどれも同じクラスとなります)。そしてそのクラスはその GCO を構成する Unicode 文字にアサインされたクラスにより決定することができます。通常は GCO のベース Unicode 文字のクラスがその GCO のクラスです。しかし、その他の文字がクラスを乗っ取ることもあります。例えば:<U+00A0 NO-BREAK SPACE> は一つのクラスで <U+00A0 U+0301 COMBINING ACUTE> は別のクラスかもしれません(木田:ここ、意味がわからなかったので、Eric に聞きます)。 > > GCOは例えばÀ (U+00C0)だとU+0041 U+0300としても表記できて2文字が一つのGCOになりますが、この > 場合はU+0041とU+00C0の文字のクラスは(ほぼ)同じなので、U+0041とU+0041 U+0300はU+0300がついても > ベースとなるU+0041の文字のクラスのまま変わりません。 > # EAWとか違うのもあるはずなので仮定としておいてください、、、 > が、U+00A0の場合、NBSPとしての場合と、後ろにU+0301の文字がついて' ́'だけが表示される状態に > なった場合はGCOは空白としては扱わなくなるので、ベースUnicode文字のクラスがGCOのものと同じにな > るとは限らないよ。 > > ・・・という話かと思います。 > > # 例示が難しいですよねこれ。。 > > >> ======== >> カラムの説明: >> 1. コードポイント >> 2. UAX50の縦書きプロパティ >> 3. 横書きクラス >> * H ならカラム 5 に書いてあるクラス >> * ブランクなら漢字(と同じ扱い) >> 4. 縦書きクラス >> * V ならカラム 5 に書いてあるクラス >> * ブランクなら漢字(と同じ扱い) >> 5. クラス >> 6. A と書いてあれば、もしこのテキストのスクリプトが中国語か日本語(Hans, Hant, Jpan)でないなら、クラスは westernChar > > 木田さんのメールのテキスト側には番号が振ってない(htmlメール側でliでリストされてる)ので一応 > 番号付きで引用しておきます。 > <OpenPGP_0x72397AFC0905265D.asc>
Received on Thursday, 29 October 2020 13:10:27 UTC