Re: 文字クラスの国際化: Appendix B 文字間の空き量の表より

cl-19 と 27 についてまとめてみました。

cl-19 の再分類
英字との間にアキの欲しい「漢字的なもの」とそうでないもの。

>> ですから,見た目のバランスが問題ですから,アキは四分でなくてもよいので
>> (活字では,材料の関係で,四分が選ばれたのです),活字組版では,四分アキ
>> にしないで,二分アキにした例もありました.また,ベタ組にした例もけっこう
>> ありましたし,それでも読めるという意味では読めました.ただ,“体裁よくな
>> いな”と言われる恐れはありますが,
>> 
>> このアキはフォントの設計もよるでしょう.最近の印刷物を見ていると,四分よ
>> り狭い組版をよく見かけますし,ベタ組でも,文字の並びによっては問題ない
>> ケースもありますが,逆に文字の組み合わせで,ベタ組だと,えらく詰まった
>> ケースもあり,悩ましい問題です.
>> 
>> 一つの考え方として,ある限られた欧文,それと漢字と仮名だけの字間を空ける
>> 処理ができるようにして,あとは“知らん”(つまりベタ組)といってもよいか
>> もしれない.
> 
> 確かに、記号ではない発音できる文字+もしあれば少数の追加文字、についてはアキを定義して、そうでない場合には放っておく方が、少なくとも理解・管理がしやすいように思います。
> 
> アキを開ける対象として、漢字(Ideograph)と仮名は当然として、他に必要な文字はあるでしょうかね。韃靼文字など、中国の漢字の派生的な文字である and/or 全角である and/or 単語間に空白がない文字、これは仮名もそうですね、は入れるのが適当に思えます。きちんとリストできるか見てみます。
> 
> 現在 cl-19 に入っている全ての約物、記号は cl-19 から除外して良いでしょうか?

cl-19 に含まれる非漢字のうち、英字との間にアキが欲しい「漢字的なもの」の候補を拾い出してみました。

cl-19 のうち下のものは記号の分類ではありますがほぼ漢字のように見えるもの。
これらはどうでしょう?
U+3003 〃 DITTO MARK
U+3006 〆 IDEOGRAPHIC CLOSING MARK
U+3007 〇 IDEOGRAPHIC NUMBER ZERO
U+3013 〓 GETA MARK
U+303C 〼 MASU MARK
U+303D 〽 PART ALTERNATION MARK


下のものは前置省略記号的であって、前置省略記号はハイフン類と同じ字間の挙動をしますので、同じ、つまり約物を全角としてベタ、で良いですかね?
U+337B	㍻	SQUARE ERA NAME HEISEI
U+337C ㍼ SQUARE ERA NAME SYOUWA
U+337D ㍽ SQUARE ERA NAME TAISYOU
U+337E ㍾ SQUARE ERA NAME MEIZI

下のものは元々カタカナですが、顔つきのもの共々前置省略記号的、つまりベタですかね
U+3012	〒	POSTAL MARK	郵便記号
U+3020	〠	POSTAL MARK FACE	郵便マーク

丸付き数字、漢字、片仮名はベタでしょうか。でないと箇条書きに使いにくいです。

下のものは漢字を含みますが、括弧を持っていますのでベタっぽいですね
U+3231	㈱	PARENTHESIZED IDEOGRAPH STOCK
U+3232 ㈲ PARENTHESIZED IDEOGRAPH HAVE
U+3239 ㈹ PARENTHESIZED IDEOGRAPH REPRESENT
これらをどうするかは、下のような現在 cl-19 / JIS X 0213 以外の漢字囲み文字たちをどうするべきか、また漢字でない囲み文字たちをどうするべきかにも関係してきます:
㈠㈡㈢㈣㈤㈥㈦㈧㈨㈩㈪㈫㈬㈭㈮㈯㈰㈱㈲㈳㈴㈵㈶㈷㈸㈹㈺㈻㈼㈽㈾㈿㉀㉁㉂㉃㉄㉅㉆㉇㊀㊁㊂㊃㊄㊅㊆㊇㊈㊉㊊㊋㊌㊍㊎㊏㊐㊑㊒㊓㊔㊕㊖㊗㊘㊙㊚㊛㊜㊝㊞㊟㊠㊡㊢㊣㊤㊥㊦㊧㊨㊩㊪㊫㊬㊭㊮㊯㊰

全角の英字や数字、これらはプロポーショナルの英字や数字と使うべきではないのでしょうけれど、もし使われたらベタで良いでしょうかね。

以上で cl-19 を、英字との間にアキが必要な「漢字的なもの」と、ベタに組む「漢字的でないもの」に分けることができます。


cl-27 の再分類
このように cl-19 を分けると、同様の問題が cl-27 にも生じます。cl-27 には単語を構成する字(Unicode で言う Letter)以外に、記号や約物が含まれます。cl-19 の多くの記号や約物が cl-27 にも重複して所属していますので、ベタのクラスを作るなら、これらおよも cl-27 からベタクラスに移動が合理的に思えます。ただし英字と同じように漢字との間を空けるのが適当な文字があるかもしれません。

cl-27 に含まれるものを General Category の大分類で見てゆきますと、
C (Other) のソフトハイフン:これはアキ不要ですね
Z (Separator) のノーブレークスペース:これもアキは不要ですね
S (Symbol) :
Sm (Math Symbol):これは? 仮名漢字の隣にプロポーショナルの演算記号、あまり重要なケースには思えませんが決める必要がありますね
Sc (Currency Symbol):通貨記号
Sk (Modifier Symbol):これはベースの英字に付ける文字なので、単独で現れないはずのもの
So (Symbol Other):種々雑多ないわゆる記号。幾何学的な形の記号、絵文字的なもの、矢印、丸付きアルファベット、などなど。これらもアキは不要に思います
P (Punctuation) 種々の約物
N (Number) 種々の数字。数字、丸付き数字、分数。このうち普通の数字は漢字との間にアキを要求するとして(下記メモ参照)、丸付き数字は不要、分数は?
L (Letter) アルファベットの類。これは明らかに漢字との間にアキを要求しますね

数字と漢字の間のアキについて
数字と漢字の間にアキを入れるべきか、私は悩ましいと思います。例えば:

 今日は3月22日です

 今日は 3月 22日です

 今日は 3 月 22 日です

最初のはOK。次のは数字が強調される感じ。最後のは違和感があります。何か空欄付きのフォームに数字を書き入れたような後付け感。ここで使っているのは欧文空白で私の環境では漢字に比べて約三分の大きさですが、これをワープロなどで四分になるように調節しても印象は同じです。「料金は 10,500 円」など桁数が大きくなると後ろ側が空いていても違和感が少なくなりますが、やはり後ろの単位にくっついている方が自然に思えます。

ここにはおられませんが、数字に関して潤平さんも似たようなことを言っておられました。

木田

Received on Monday, 22 March 2021 07:21:12 UTC