- From: Atsushi Shimono (W3C Team) <atsushi@w3.org>
- Date: Thu, 29 Oct 2020 21:25:12 +0900
- To: public-i18n-japanese@w3.org
- Message-ID: <24c4b599-baa6-4474-4196-c8d463e13c68@w3.org>
On 2020/10/29 20:44, 木田泰夫 wrote: > GCO のクラスはマークアップによって明示的に指定することもできます、が、多くの場合はその GCO を構成する Unicode 文字からクラスを決定します(その場合、同じ GCO はどれも同じクラスとなります)。そしてそのクラスはその GCO を構成する Unicode 文字にアサインされたクラスにより決定することができます。通常は GCO のベース Unicode 文字のクラスがその GCO のクラスです。しかし、その他の文字がクラスを乗っ取ることもあります。例えば:<U+00A0 NO-BREAK SPACE> は一つのクラスで <U+00A0 U+0301 COMBINING ACUTE> は別のクラスかもしれません(木田:ここ、意味がわからなかったので、Eric に聞きます)。 GCOは例えばÀ (U+00C0)だとU+0041 U+0300としても表記できて2文字が一つのGCOになりますが、この 場合はU+0041とU+00C0の文字のクラスは(ほぼ)同じなので、U+0041とU+0041 U+0300はU+0300がついても ベースとなるU+0041の文字のクラスのまま変わりません。 # EAWとか違うのもあるはずなので仮定としておいてください、、、 が、U+00A0の場合、NBSPとしての場合と、後ろにU+0301の文字がついて' ́'だけが表示される状態に なった場合はGCOは空白としては扱わなくなるので、ベースUnicode文字のクラスがGCOのものと同じにな るとは限らないよ。 ・・・という話かと思います。 # 例示が難しいですよねこれ。。 > ======== > > カラムの説明: > > 1. コードポイント > 2. UAX50の縦書きプロパティ > 3. 横書きクラス > * H ならカラム 5 に書いてあるクラス > * ブランクなら漢字(と同じ扱い) > 4. 縦書きクラス > * V ならカラム 5 に書いてあるクラス > * ブランクなら漢字(と同じ扱い) > 5. クラス > 6. A と書いてあれば、もしこのテキストのスクリプトが中国語か日本語(Hans, Hant, Jpan)でないなら、クラスは westernChar 木田さんのメールのテキスト側には番号が振ってない(htmlメール側でliでリストされてる)ので一応 番号付きで引用しておきます。
Attachments
- application/pgp-keys attachment: OpenPGP_0x72397AFC0905265D.asc
Received on Thursday, 29 October 2020 12:25:19 UTC