Re: 文字クラス整理 20日ミーティング・メモ

木田泰夫 様
みなさま

 小林 敏 です.

文脈に依存する文字クラスの扱いについて,別の面から考えてみました.

文脈に依存する文字クラスは,大きく2つに分けられます.

a 文字列を<span>…</span>などでくくり,属性指定が必要

> 合印中の⽂字(cl-20)
> 親⽂字群中の⽂字(添え字付き)(cl-21)
> 親⽂字群中の⽂字(熟語ルビ以外のルビ付き)(cl-22)
> 親⽂字群中の⽂字(熟語ルビ付き)(cl-23)
> 割注始め括弧類(cl-28)
> 割注終わり括弧類(cl-29)
> 縦中横中の⽂字(cl-30)

b 文字列を<span>…</span>などでくくり,特に属性指定を必要としない

> 連数字中の文字(cl-24)
> 単位記号中の⽂字(cl-25)

aは,該当文字の振る舞いについては,なんらかの属性指定が必要なので,その
属性を適用すればよく,属性を説明(規定)すれば,その振る舞いは決まる.特
に文字クラスとして,つまり個々の文字の振る舞いを明示しなくてよい.

bは,結論から言えば,特に,この2つの文字クラスを作成しないで,一般の欧文
のルールで基本的によい.

連数字中の文字(cl-24)は,そもそも,今ではこのような文字は使われていな
いということから削除を考えたわけです.しかし,連数字には,アラビア数字以
外にコンマ,ピリオドと四分スペースが含まれていますが,四分スペース(これ
の扱いは後述)以外は,欧文文字に含まれるアラビア数字,コンマ,ピリオドと
同じ振る舞いであり,連数字があったとしても,特に別の文字クラスにする必要
はないのです.(アラビア数字の位取りや小数点のコンマ,ピリオドの前後では
2行にわたる分割禁止ですが,これは一般の欧文でもコンマ,ピリオドの後ろに
欧文スペースが入ら場合と同じで分割禁止.)

単位記号も,実は同じです.問題は,乗算を示す方法として,単位記号中に四分
スペースが入る形式もある(これはJLReqで含まていないいと前に書いたが,単
位記号の文字クラスにはスペースも含めているので,これも含む).この四分ス
ペースの問題を除くと,欧文文字と同じ振る舞いであり,別の文字クラスにする
必要がない.

次に,連数字や単位記号に含まれる四分スペースについてですが,これは,この
を属性で指示するのか,あるいはなんらかのスペースを入れるかということにな
る.属性で指示するなら文字クラスの必要性が出てくるが,実務を考えれば,そ
れは手間であり,なんらかのスペースを入れればよい.つまり分割を禁止する四
分スペースがあればよい.

U+2005(FOUR-PER-EM SPACE)は四分スペースですが,これは分割禁止しないの
では? また,U+00A0(NO-BREAK SPACE)またはU+202F(NARROW NO-BREAK 
SPACE)は分割禁止だが,アキの大きさはどうなっているのかな? U+2007
(FIGURE SPACE)は分割禁止だが,数字の字幅と同じなので,位取りの場合には
使いたくない.U+2060(WORD JOINER)も分割禁止だが,これはアキがないので
は?

U+2061(FUNCTION APPLICATION)とU+2062(INVISIBLE TIMES)は,連数字や単
位記号に含まれる四分スペース用みたいだが,アキの大きさは?

U+200B(ZERO WIDTH SPACE)とU+2005(FOUR-PER-EM SPACE)の四分スペースを
組み合わせればいいのかな?

最後の問題は,単位記号の前に配置するアラビア数字または量を示す欧字との字
間の問題

ここのU+2005(FOUR-PER-EM SPACE)またはU+0020(SPACE)を入ればよい.つま
り,一般の欧文のルールで解決できる.

以上です.
 

Received on Sunday, 18 October 2020 00:50:16 UTC