Re: 文字クラスの国際化: Appendix B 文字間の空き量の表より

木田泰夫 様
みなさま

 小林 敏 です.

  木田泰夫 さんwrote

>敏先生、少しづつ回復しておられるとのこと、よかったです。

徐々にといった感じです.

>敏先生の、最初からやり直してみるのはどうだというお言葉に触発されて、まずは自
>分の理解のために字間に関して現状どのようなルールになっているのかを整理してみ
>ました。Unicode に広げる前に足元をちゃんと理解しておくということです。いくつ
>か疑問点が出てきました。

>まず日本語組版の要件(最新版は英語と日本語が混じっていて見にくくなってしまい
>ましたね)Appendix B 文字間の空き量の表を整理すると、下の表のように頭の中で把
>握できるくらいのサイズになりました。(どのように整理したかを一番下に書いてお
>きました)
>
>------------------------------------------------------------------------
>
>
>・青いカラムは Appendix B に注記のある場所
>・薄灰赤のカラムは行頭や行末との接続
>・黄色いカラムは質問・疑問のある場所
>
>
>和文の約物は、アキ要求を使って大雑把に五つに分類できるようです。
>
> A) 前側にアキを要求する:cl-01 始め括弧類
> B) 後側にアキを要求する:cl-02 終わり括弧類、cl-06 句点、cl-07 読点
> C) 両側にアキを要求する:cl-05 中点類
> D) 常にベタ      :cl-03 ハイフン類、cl-08 分離禁止文字、(cl-04 区切
>り約物)
> E) 英字との間に四分アキ:cl-09 繰返し記号、cl-10 長音記号、cl-11 小書きの仮
>名、cl-15 平仮名、cl-16 片仮名、cl-19 漢字類
>
>Appendix B の表にないので上の表には含めませんでしたが、cl-17 等号類、cl-18 演
>算記号はコンテキスト依存ですが基本ベタ。そしてデフォルトをベタにしておかない
>とコンテキストに応じた調節が効きません。ゆえ、自動処理的には常にベタの D に含
>めて良さそうです。

こうした要約した理解は,考える際によい方法かと思います.そのうえで細部を
考えていけばよいかと思います.

以下,具体的に事項について私の考えていることを記しておきます.

>いくつか疑問が出てきます:
>
>・B に分類される終わり括弧類と句読点は、二点を除いて振る舞いが同じです。一つ
>は後ろに和字間隔が来る時です。終わり括弧類の後ろに和字間隔が来た場合は二分詰
>め、句読点の後ろに和字間隔が来た場合はそのまま。もう一点は、後ろに中点類が来
>る場合です。終わり括弧類の後ろに中点類が来る場合には、終わり括弧側を二分詰め、
>つまり中点側の四分が残ります。句読点の後ろに中点類が来る場合には、双方を詰め
>てベタにします。これらは頻繁なケースではないように思え、それなら終わり括弧類
>と句読点のルールを一致させて単純化しても良いのではないか、と思うのですが、ど
>うでしょう?

最初に,括弧類と和字間隔,括弧類と中点類の連続

括弧類と和字間隔,括弧類と中点類の連続は,多くはありませんが,それなりに
あります.以下に例を示します.和字間隔を“□”で示す.
 1)□この問題……
 注記で括弧で番号をくくり,その後ろを全角アキにする.中点の
 「句読点」□「括弧」
 「句読点」・「括弧」
括弧で括った用語を全角アキで並べる.この例では中点にする場合もあります.
 そうなのか?□「では…
疑問符,感嘆符の全角アキの後ろに括弧類を配置

このような場合,括弧類の二分アキをそのままにするとアキ過ぎになります.で
すので,上のようなルールが考えられたのです.

ですので,括弧類と和字間隔,括弧類と中点類の連続に特別に詰める規定を採用
することは意味があります.

次に句読点と和字間隔,括弧類と中点類の連続

これは木田さんの説明(句読点の後ろに中点類が来る場合には、双方を詰めてベ
タにする)ではなく,句読点の後ろ二分アキ,中点の前は四分アキ,つまり,そ
れぞれ全角で並べる.和時間隔の場合も同じで,詰めない.

これは,実際に起こる例は,あまり考えられません.ですので,ある意味,どう
決めてもいいような問題です.ただし,規則として何か決めないといけないので,
ある意味で適当な(ある意味,いいかげん,といってもよい)で決めてよいこと
です.

また,これには別の事情があります.JIS X 4051では句点は全角絶対主義です
(行末の必ず全角でないといけない,これは私は反対しているが,私の参加して
いない第二次規格で決まった).こうしたこともあり,句点と和字間隔,句点と
中点は,括弧類と扱いが別になった.

一方,JIS X 4051では,読点は終わり括弧類に含ませているので,扱いは括弧類
と同じです.JIS X 4051では,終わり括弧類と読点は同じ扱いだが,句点は異な
る.

こうした経過のもとで,JLReqでは,読点を独立させた.その際に読点を句点と
揃えるために,上のようにしたものです.JLReqでは,この事情は注記にしるし
てある.(句点全角主義のことは記していない.)

ですから,句読点と和字間隔,括弧類と中点類の連続を括弧類と同じにする,つ
まり,括弧類の規則に合わせることは,私は,まったく問題はないと考えていま
す.

ただし,行の調整処理を考えると,終わり括弧類と読点は同じ扱いでよいが,句
点は調整で詰めたくないので,別扱いにする必要がある.

さらにいえば,APLの報告書で行の調整処理で詰める調整を採用しない簡略な案
を考えました.この簡略な案で考えれば,終わり括弧類と読点と句点との差異は
なくなるので,同じ文字クラスにできる.

ついではいえば,終わり括弧類と読点と句点では,ルビをはみ出しを掛ける問題
でも,注記の合印を処理する場合でも,同じ扱いができるので文字クラスとして
は同じ扱いにできる.

>・cl-04 区切り約物(疑問符感嘆符)の挙動は D と E の中間で、後ろが英字の場合
>のみ四分アキです。この場合にもベタにするのは不都合でしょうか? 文章の入力時、
>後ろが和字の場合には手で空白を入力し、後ろが英字なら空白を入力しない、という
>のは次に入力する字種が決まらないと空白を入れるべきかどうかわからないという意
>味で、使い心地もあまり良くないような気がします。

ここも,ある意味,どちらでもいい事項.そもそも,“cl-04区切り約物”(疑
問符,感嘆符)の後ろは,通常は和字間隔です.和字間隔が入らない場合は,文
章の途中に“cl-04区切り約物”が入る場合です.以下に例を示す.
 それってヤギ,それともヒツジ?と,私は気になった
 大化けするかも?っていう
この場合,以下のよう記すことができます.
 意味不明(?)な言葉

つまり,実際の用例はありますが,あまり一般的でない.しかも,それが英字に
なるケースはほとんどない.

>・隣接する間隔文字が和文か欧文かで動作の異なる場合が一つだけあります。始め括
>弧の前に間隔文字が来たり、終わり括弧の後ろに間隔文字が来る場合、和文の場合の
>み半角詰め。この差は合理的でしょうか?

和文の括弧類に和字間隔が連続する場合は,用例もあるし,括弧類や句読点の前
後の二分アキを詰めることは前述したように意味があります.

次に括弧類や句読点の前後の欧文間隔が配置されるケースは,ちょっと私は用例
が考えられない.ですので,ある意味で適当に決めればよい事項です.

>・もしかすると Unicode への拡張を考えるとこれが一番影響が大きいかもしれません。
>E は英字との間に四分アキを要求します。E に含まれるクラス名を見るとどれも音価
>をもった文字のように見えるのですが、これは、和文単語と英字が連続する場合、英
>字側から見た単語の区切りとして、空きがその間に来ることを要求するのだと考える
>とすんなり理解できます。そのように理解するとき、cl-19 に含まれる大量の記号文
>字が気になります。これらの記号も英字との間を四分アキにするのが適当でしょう
>か? 例えば丸数字 ① で箇条書きにするような場合、文頭に和字が来るか英字が来
>るかで文頭が揃わない、など不都合が色々考えられそうです。逆に、cl-19 の記号と
>英字の間に自動的な四分空きがあるべきケースにはどのようなものがあるでしょう
>か?

和文と英字との間隔の問題

この問題は,意味上の必要からでてきた問題ではないと思います.確かに欧文は,
単語間にスペースを入れます.日本語ではいれません.しかし,漢字仮名の中に
英語の単語,あるいは複数の語句の連続が挿入されたからといって,漢字と英語
の間にスペースをいれて単語を区別する必要性はありません.

なぜなら,日本語の漢字仮名混じり文では,字間をベタにしていても,文字種で
単語の区切りがわかるのです.つまり,漢字が単語の単位を示しているからです.
ですから,仮名の多い文章では,句読点や分かち書きが必要になる例はないわけ
ではないが,一般的にいって語と語の区切りにスペースを入れる必要性は少ない
のです.これは,日本語の中に片仮名や英字,英字の単語が挿入されても同じで,
スペースを入れなくても,単語に分けられるのです.

ついでにいえば,漢文は,ちょっと事情が異なり,単語を区別できないではない
か,それでも語間を空けないのはなぜか,という問題はあります.これは,原則,
漢文では1字1字が一般に1語だからということのようです.でも,一般人にとっ
ては,とても読めない,そこで,句読点を入れる必要があるのです.

ではなぜ和文と英文との字間を空けるかは,もっぱら見た目のバランスの問題で
す.文字の設計が異なるからです.和文は,全角の台に対し,文字により異なり
ますが,ある程度の余白があります.これに対し,欧文では,その上下にはアキ
はありますが,その左右には,ごく僅かのアキしかありません.しかも,そのご
くわずかのアキは,欧文を並べた際に単語の字間均一に見えるように設計されて
います.

この文字の設計の違いが,和文と欧文をベタ組で並べた際に,和文の字間に対し,
和文と欧文の間だけが詰まった印象を与えるので,和文と欧文の字間を四分アキ
にしたのです.

ですから,見た目のバランスが問題ですから,アキは四分でなくてもよいので
(活字では,材料の関係で,四分が選ばれたのです),活字組版では,四分アキ
にしないで,二分アキにした例もありました.また,ベタ組にした例もけっこう
ありましたし,それでも読めるという意味では読めました.ただ,“体裁よくな
いな”と言われる恐れはありますが,

このアキはフォントの設計もよるでしょう.最近の印刷物を見ていると,四分よ
り狭い組版をよく見かけますし,ベタ組でも,文字の並びによっては問題ない
ケースもありますが,逆に文字の組み合わせで,ベタ組だと,えらく詰まった
ケースもあり,悩ましい問題です.

一つの考え方として,ある限られた欧文,それと漢字と仮名だけの字間を空ける
処理ができるようにして,あとは“知らん”(つまりベタ組)といってもよいか
もしれない.


>敏先生、この辺り、ご無理のない範囲でご教授いただけると嬉しいです。
>
>木田
>
>–––––––––––
>表を整理した方法
>
>1) 「…中の文字」というコンテキストに依存した文字クラスを省略
>2) 今までの議論で削除することになったクラス(cl-12, 13 前置後置省略記号)を省
>略
>3) 数値以外の情報を省略。注記に言葉で表されている空き量を表の中に
>4) 動作が全く同じ文字クラス同士はひとまとめに
>5) デジタルフォントにおいて、約物の前後の空白がグリフに含まれている場合、その
>グリフからの修正値に変更。それらはクラス名を「…グリフ」と変えてあります。こ
>れらは修正値がマイナスになります。
>–––––––––––

Received on Saturday, 20 March 2021 05:46:23 UTC