文字クラスの国際化: Appendix B 文字間の空き量の表より

敏先生、少しづつ回復しておられるとのこと、よかったです。

敏先生の、最初からやり直してみるのはどうだというお言葉に触発されて、まずは自分の理解のために字間に関して現状どのようなルールになっているのかを整理してみました。Unicode に広げる前に足元をちゃんと理解しておくということです。いくつか疑問点が出てきました。


まず日本語組版の要件(最新版は英語と日本語が混じっていて見にくくなってしまいましたね)Appendix B 文字間の空き量の表を整理すると、下の表のように頭の中で把握できるくらいのサイズになりました。(どのように整理したかを一番下に書いておきました)


・青いカラムは Appendix B に注記のある場所
・薄灰赤のカラムは行頭や行末との接続
・黄色いカラムは質問・疑問のある場所


和文の約物は、アキ要求を使って大雑把に五つに分類できるようです。

 A) 前側にアキを要求する:cl-01 始め括弧類
 B) 後側にアキを要求する:cl-02 終わり括弧類、cl-06 句点、cl-07 読点
 C) 両側にアキを要求する:cl-05 中点類
 D) 常にベタ      :cl-03 ハイフン類、cl-08 分離禁止文字、(cl-04 区切り約物)
 E) 英字との間に四分アキ:cl-09 繰返し記号、cl-10 長音記号、cl-11 小書きの仮名、cl-15 平仮名、cl-16 片仮名、cl-19 漢字類

Appendix B の表にないので上の表には含めませんでしたが、cl-17 等号類、cl-18 演算記号はコンテキスト依存ですが基本ベタ。そしてデフォルトをベタにしておかないとコンテキストに応じた調節が効きません。ゆえ、自動処理的には常にベタの D に含めて良さそうです。



いくつか疑問が出てきます:

・B に分類される終わり括弧類と句読点は、二点を除いて振る舞いが同じです。一つは後ろに和字間隔が来る時です。終わり括弧類の後ろに和字間隔が来た場合は二分詰め、句読点の後ろに和字間隔が来た場合はそのまま。もう一点は、後ろに中点類が来る場合です。終わり括弧類の後ろに中点類が来る場合には、終わり括弧側を二分詰め、つまり中点側の四分が残ります。句読点の後ろに中点類が来る場合には、双方を詰めてベタにします。これらは頻繁なケースではないように思え、それなら終わり括弧類と句読点のルールを一致させて単純化しても良いのではないか、と思うのですが、どうでしょう?


・cl-04 区切り約物(疑問符感嘆符)の挙動は D と E の中間で、後ろが英字の場合のみ四分アキです。この場合にもベタにするのは不都合でしょうか? 文章の入力時、後ろが和字の場合には手で空白を入力し、後ろが英字なら空白を入力しない、というのは次に入力する字種が決まらないと空白を入れるべきかどうかわからないという意味で、使い心地もあまり良くないような気がします。


・隣接する間隔文字が和文か欧文かで動作の異なる場合が一つだけあります。始め括弧の前に間隔文字が来たり、終わり括弧の後ろに間隔文字が来る場合、和文の場合のみ半角詰め。この差は合理的でしょうか?


・もしかすると Unicode への拡張を考えるとこれが一番影響が大きいかもしれません。E は英字との間に四分アキを要求します。E に含まれるクラス名を見るとどれも音価をもった文字のように見えるのですが、これは、和文単語と英字が連続する場合、英字側から見た単語の区切りとして、空きがその間に来ることを要求するのだと考えるとすんなり理解できます。そのように理解するとき、cl-19 に含まれる大量の記号文字が気になります。これらの記号も英字との間を四分アキにするのが適当でしょうか? 例えば丸数字 ① で箇条書きにするような場合、文頭に和字が来るか英字が来るかで文頭が揃わない、など不都合が色々考えられそうです。逆に、cl-19 の記号と英字の間に自動的な四分空きがあるべきケースにはどのようなものがあるでしょうか?


敏先生、この辺り、ご無理のない範囲でご教授いただけると嬉しいです。

木田

–––––––––––
表を整理した方法

1) 「…中の文字」というコンテキストに依存した文字クラスを省略
2) 今までの議論で削除することになったクラス(cl-12, 13 前置後置省略記号)を省略
3) 数値以外の情報を省略。注記に言葉で表されている空き量を表の中に
4) 動作が全く同じ文字クラス同士はひとまとめに
5) デジタルフォントにおいて、約物の前後の空白がグリフに含まれている場合、そのグリフからの修正値に変更。それらはクラス名を「…グリフ」と変えてあります。これらは修正値がマイナスになります。
–––––––––––

Received on Friday, 19 March 2021 14:04:53 UTC