Re: Unicode に拡張した字間プロパティ 8/3 version

クラス J の拡張について、仮名や漢字っぽいけれど漢字でないものについて、固めておきたいと思います。これらについて昨日のミーティングで:
〇 は数字の十や百などと入れ替わるので入れる
〓 はどちらでも良い
となりました。残りの他の仮名や漢字っぽいものはどうでしょう。個々の文字についてどうこうよりも、意味、由来、デザイン、用法、などから、入るべき、入らないべき、の基準を理解したいと思います。


現在の定義でこのクラスに入るもの。太字は入る理由。
ゝ	U+309D	HIRAGANA ITERATION MARK (GC=Lm, Script=Hiragana)
ゞ U+309E HIRAGANA VOICED ITERATION MARK (GC=Lm, Script=Hiragana)
ヽ U+30FD KATAKANA ITERATION MARK (GC=Lm, Script=Katakana)
ヾ U+30FE KATAKANA VOICED ITERATION MARK (GC=Lm, Script=Katakana)
〆 U+3006 IDEOGRAPHIC CLOSING MARK (GC=Lo, Ideographic, Script=Common)
〇 U+3007 IDEOGRAPHIC NUMBER ZERO (GC=Nl, Ideographic, Script=Han)
〡〜〺 U+303A〜U+3021	蘇州号碼 (GC=Nl, Ideographic, Script=Han)

入っていないもの(Block=Katakana)
ー	U+30FC	KATAKANA-HIRAGANA PROLONGED SOUND MARK cl-10
゠ U+30A0 KATAKANA-HIRAGANA DOUBLE HYPHEN cl-03
・ U+30FB KATAKANA MIDDLE DOT cl-05

入っていないもの cl-09(Block = CJK Symbols and Punctuation)
々 U+3005 IDEOGRAPHIC ITERATION MARK (Script=Han, GC=Lm)
〻 U+303B VERTICAL IDEOGRAPHIC ITERATION MARK (Script=Han, GC=Lm)
〱 U+3031 VERTICAL KANA REPEAT MARK(およびその断片)(Script=Common, GC=Lm)
〲 U+3032 VERTICAL KANA REPEAT WITH VOICED SOUND MARK(およびその断片)

入っていないもの cl-19(Block = CJK Symbols and Punctuation, Script=Common)
〓 U+3013 GETA MARK (GC=So)
〼 U+303C	MASU MARK (GC=Lo)
〃	U+3003	DITTO MARK (GC=Po)
––––––––––––––––––––––––––––––––––––––––––––––––––––

Received on Wednesday, 4 August 2021 05:37:59 UTC