文脈依存の文字クラス

木田泰夫 様
みなさま

 小林 敏 です.

  木田泰夫 さんwrote


>1. 文脈依存クラスをどうするか
>前回の議論は、文字クラスを純粋な文字のプロパティにするために、文脈依存クラス
>を無くすことが目的でした。そのようなケースは説明で処理するという解決方法を議
>論しました。
>
>Eric はこれとは異なる解決方法を提案していて、それは非常に優れた方法に感じられ
>ます。彼の提案は、縦中横、などの仮想クラスを導入すること。
>
この件についは

1 名前はどすうるかは別にして,文字クラスに残すことは考えられる.その場
合,以前のメールに書いたように,例えば,“親⽂字群中の⽂字(熟語ルビ付
き)”でいえば,親文字群の内部における字間について表では何もいわず,あく
まで“親⽂字群中の⽂字(熟語ルビ付き)”の前またた後ろに配置する文字との
関係だけを問題とする,つまり,外部だけを問題とする.

2 となると,名称が問題で,“割注始め括弧類(cl-28)”と“割注終わり括弧
類(cl-29)”は,併せて“割注”と名称を変え,“割注”いう全体を1つの文字
と考え,その前または後ろ文字との関係だけを問題とする.他では,以下のよう
になる.つまり“××中の文字”と,今のJLReq(JIS X 4051)は,あくまで各
文字と考えたので,問題が複雑になったことだったのでしょう.
 合印中の⽂字(cl-20) → 合印の組
 親⽂字群中の⽂字(添え字付き)(cl-21) → 添え字付き親⽂字群
 親⽂字群中の⽂字(熟語ルビ以外のルビ付き)(cl-22)と親⽂字群中の⽂字
(熟語ルビ付き)(cl-23)は合併して → ルビ付き親⽂字群
 単位記号中の⽂字(cl-25) → 単位記号の組
 縦中横中の⽂字(cl-30) → 縦中横の組

となれば,分離禁⽌⽂字(cl-08)も,“分離禁止文字の組”という仮想の文字
クラスを作成すれば,分離禁⽌⽂字(cl-08)は,かなや漢字などの文字クラス
に含めてしまってもよい.分離禁止文字は,“くの字点”以外は個々の文字とし
ても使用され,また“分離禁⽌⽂字の組”としても使用されます.
なお,分離禁止文字の組は以下です.
 ― + ― U+2014
 … + … U+2026
 ‥ + ‥ U+2025
 〳 + 〵 U+3033 + U+3035
 〴 + 〵 U+3034 + U+3035

なお,“組”は,セット(set)の意味で用いた.

Received on Monday, 2 November 2020 23:39:09 UTC