- From: Atsushi Shimono (W3C Team) <atsushi@w3.org>
- Date: Thu, 3 Dec 2020 03:15:38 +0900
- To: public-jlreq-admin@w3.org
- Message-ID: <05909bdf-1b7c-4b9f-2cf9-a5478af3981a@w3.org>
On 2020/12/01 16:28, 木田泰夫 wrote: > さて今日 2020·12·01のミーティングメモです。 > > 1. 今日の一番大きなポイントはおそらく、JLReq の示しているコードポイント、ひいては JIS X 0213 & Unicode の合意によるアサインメントにはてなマークをつけた、つまりお国に反旗を翻したことでしょう。ハイフン類、三点リーダ、クオーテーションなどにおいて、お互いに似た和文、欧文の約物が統合されているのだけれど、グリフの設計が異なるだけではなくて、振る舞いが異なるということです。「プロポーショナルな文字に欧文空白を組み合わせて全角っぽくするのは間違ってる!」という小林さんの叫びも聞こえてきました。 > > はてなマークを付けたのは下の文字たちです: : : : > また、全角二倍、全角三倍ダーシも、JLReq の表にはありませんがこの範疇です。 > 3. いくつかの約物を欧文専用として和文用のクラスから抜くことになり、 ここにつなぐのがいいのかは微妙かもしれませんが、、やらなきゃとずっと思っていながら手を付け られていなかったEAWでフィルターした文字セットと比較というのをcl-01についてやってみました。 # 作業シート添付、cl-01シートはJLreq cl-01からコピー、UnicodeシートがGeneral Category Ps/Pi cl-01のセットはJLreqオリジナルで 0028, 005B, 007B, 00AB, 2018, 201C, 2985 3008, 300A, 300C, 300E, 3010, 3014, 3016, 3018, 301D で、00xxをFFxxに置き換えると FF08, FF3B, FF5B, FF5F です。 Unicode Ps/Piの75+12の合計87文字の中で、EAWで分けると、関連するのは、Fが4つ(上のFFxx)で、 Aが2つ(上の20xx)、Wが24こです。このうち、FExxの縦書き(vertical variants)が10こ、FE5xの small form variantsが3つ、Deprecatedが1こ(U+2329)を除くと、残り10こになります。これらは、 3008, 300A, 300C, 300E, 3010, 3014, 3016, 3018, 301A, 301D です。 というところで、 ・General Category = Ps/Pi ・EAW = F/A/W ・縦書き用、Deprecated、small form variants を除く のandを取ったセットと現在議論・更新中のcl-01のセットの差は ・cl-01で"?"を付けたものを除くとしたら EAW = A は不要 ・cl-01に U+301A がない となります。 文字セットからプロパティーセットへの転換は意外と簡単にケリがつくのかも、です?
Attachments
- application/octet-stream attachment: jlreq-cl-01.xlsx
- application/pgp-keys attachment: OpenPGP_0x72397AFC0905265D.asc
Received on Wednesday, 2 December 2020 18:15:45 UTC