Re: [jlreq] JLreq TF meeting notes 6/30 (#284)

>JLreq TF meeting notes 6/30
>The next meeting will be on 8/3 to discuss on the summary of expanding 
>character class to Unicode. Kida is to finish the document by then.

ご参考までに,以前に作成した“仮想文字クラスの追加.txt”のデータを添付し
ておきます.

●仮想文字クラス (2020.11.6,小林敏)

文字クラスに仮想文字クラスを追加する.

1 仮想文字クラスの追加の説明

文字クラスは,性格の異なる各文字を各行に配置する場合の振る舞いの違いによってグループ分けを行い,その配置方法を付表で示している.ただし,そこには“ルビ付きの親文字群”のように,あるまとまりを持つものがある.現行の文字クラスでは,例えば,“ルビ付きの親文字群の文字”のように“……の文字”として個々の文字を意味し,個々の文字の振る舞いを前提にして記述している.また,割注の場合,割注の先頭及び末尾につく括弧類だけを文字クラスにしている.つまり,“ルビ付きの親文字群”などでは,その内部での文字の配置方法と,その外部である“ルビ付きの親文字群”の先頭とその前及び末尾の後ろに配置する文字との配置方法の2つを付表では示している.ただし,内部での配置方法の多くは,注記で本文の記述を参照するようになっている.そこで,こうした配置方法を明確にするために,行中で,あるまとまりをもった文字列で,その文字列では特別の処理を必要とする文字列のまとまりを仮想文字クラスとして扱うことにした.それぞれの名称には,文字列全体のまとまりを示すために“……群”のように“群”を付した.そのうえで,個々の仮想文字クラスに含まれる文字列全体と,その外側に配置する文字との配置方法のみを付表で示すことにした.
なお,現在の付表で示している行頭及び行末という位置も文字ではないので,これらも仮想文字クラスとし,“段落先頭行の行頭”及び“段落末尾行の行末”を追加した.また,行中に配置するインライングラフィックも文字ではないので仮想文字クラスとして追加した.

2 文字クラスの削除・修正・追加

2.1 削除するもの
―連数字中の文字(cl-24)
 *これは仮想文字クラスを作成することに伴うものではなく,現在,使用されていないことによる.
―割注始め括弧類(cl-28)
―割注終わり括弧類(cl-29)

2.2 現行の内容を仮想文字クラスとして変更するもの(“←”の後ろが現行の文字クラス名)
―合印群 ←合印中の文字(cl-20)
―添え字付き親文字群 ←親文字群中の文字(添え字付き)(cl-21)
―ルビ付き親文字群 ←親文字群中の文字(熟語ルビ以外のルビ付き)(cl-22)と親文字群中の文字(熟語ルビ付き)(cl-23)を合併
―単位記号群 ←単位記号中の文字(cl-25)
―縦中横群 ←縦中横中の文字(cl-30)

2.3 現行のものを削除し,内容を変えて追加するもの
―割注群

2.4 現行の内容を仮想文字クラスとして明示するもの
―行頭
―行末

2.5 新たに追加するもの
―分離禁止文字群
―段落先頭行の行頭
―段落末尾行の行末
―インライングラフィック

3 用語定義に追加

仮想文字クラス 1文字若しくは複数の文字のまとまり(群)として,又は行中に挿入される画像として,その前後に配置する文字との字間処理及び2行にまわる分割を定義するために定めた群,及び文字ではないが,特定の位置における文字の前又は後ろの字間処理を定義するために定めた文字の配置位置.

親文字群 親文字及びそれに付随するルビ,添え字又は圏点を含めた文字のまとまり.
*親文字群の説明は,文中で行っているが,用語定義に追加する方がはっきるするので追加する.

合印群 1つの注の合印としての文字列のまとまり.

単位記号 距離,時間などをはかる基準となる量を表す“°”,“′”,“″”及び“℃”を除外したJIS Z 8000(量及び単位)に含まれる単位記号.
単位記号群 1つの単位記号としての1字又は複数の文字のまとまり.

縦中横群 1つの縦中横として処理される1字又は複数の文字のまとまり.

割注群 1つの割注として処理される文字のまとまり.割注を囲む括弧又は空きを含む.

インライングラフィック(inline graphic) 本文の一部として文字と文字との間に挿入された画像.(本文の追加や削除にともなって,本文と同じように移動する.)(JIS Z 8125)

分離禁止文字群 分離禁止文字(cl-08)に含まれる以下の文字を組み合わせた文字のまとまり.
 U+2014(―)が2つ又は3つ連続
 U+2026(…)が2つ連続
 U+2025(‥)が2つ連続
 U+3033(〳)の後ろにU+3035(〵)が連続
 U+3034(〴)の後ろにU+3035(〵)が連続

注)分離禁止文字(cl-08)は,まとまりとしては仮想文字クラスを作成し,現行の分離禁止文字(cl-08)をいずれかの文字クラスに移動することも考えたのですが,変えるのは混乱を起こす可能性もあり,そのまま残し,別に文字の組み合わせを示して仮想文字クラスを考えた.
なお,分離禁止文字のU+2014(―),U+2026(…),U+2025(‥)は,単独で用いられる場合も多く,分離禁止文字としての配置方法の記載も必要である.


-- 
GitHub Notification of comment by KobayashiToshi
Please view or discuss this issue at https://github.com/w3c/jlreq/issues/284#issuecomment-871908524 using your GitHub account


-- 
Sent via github-notify-ml as configured in https://github.com/w3c/github-notify-ml-config

Received on Thursday, 1 July 2021 04:30:38 UTC