"ideographs"の定義@CSS

 shimonoです

 いくつかのissueを受け、css-text-4の"ideographs"の定義を修正する提案が出ています。
https://github.com/w3c/csswg-drafts/pull/9503/files


 現状は
https://www.w3.org/TR/css-text-4/#ideographs


Includes all typographic character units [CSS-TEXT-3] whose base character is listed below:

* All characters in the range of U+3041 to U+30FF, except those that belong to Unicode Punctuation [P*] general category.
* CJK Strokes (U+31C0 to U+31EF).
* Katakana Phonetic Extensions (U+31F0 to U+31FF).
* All characters that have the Han script property.

 修正後は
Includes all [=typographic character units=] [[CSS-TEXT-3]] whose base character:

* belongs to Unicode Letters [L*], Mark [M*], Symbols [S*], or Numbers [N*] [=general category=], and
* has the Han, Hiragana, or Katakana [=script property=], and
* is not categorized as East Asian Halfwidth (H) by [[!UAX11]]

です。

 用途としては
text-autospace: https://www.w3.org/TR/css-text-4/#text-autospace-property

text-spacing-trim: https://www.w3.org/TR/css-text-4/#text-spacing-trim-property

の定義でspacingを入れるかどうかについてのところで利用される文字の集合になります。


 すでに石井さんよりコメントはありますが
削除される文字: https://util.unicode.org/UnicodeJsps/list-unicodeset.jsp?a=%5B%5Cu3041-%5Cu30FF%5D%5B%5Cu3041-%5Cu30FF%5D-%5B%3Agc%3DP%3A%5D-%5B%3Asc%3DHira%3A%5D-%5B%3Asc%3DKana%3A%5D-%5B%3Asc%3DHrkt%3A%5D&g=&i=gc%2Csc%2Cea

追加される文字: https://util.unicode.org/UnicodeJsps/list-unicodeset.jsp?a=%5B%3Asc%3DHira%3A%5D%5B%3Asc%3DKana%3A%5D%5B%3Asc%3DHrkt%3A%5D-%5B%3Aea%3DH%3A%5D-%5B%5Cu3041-%5Cu30FF%5D-%5B%5Cu3041-%5Cu30FF%5D&g=&i=gc%2Csc%2Cea

の変更が加わります。(なお、"whose base character"という定義ですのでこれらへの合字は含まれるはずです)

・U+30FC (ー)が抜ける
・Enclosed CJK Letters and Monthsが含まれる
・Squared Katakana Wordsが含まれる

などの変更があります。
 かなとか以外への丸付き文字に関する統一性や、そもそもU+20DDが許されたbase characterに合わせられたときはどーすんだとか、いくつかjlreqとして議論しないといけない点があるのではないか、ということで木田さんと話をしております。

 というところで、みなさま、text-spacing-*に関連した文字の集合ではありますが、こちらいかがでしょうか?

Received on Tuesday, 24 October 2023 13:40:31 UTC