Re: 文字クラスの国際化: Appendix B 文字間の空き量の表より

敏先生ありがとうございます。疑問が氷解しました。

>> 敏先生、少しづつ回復しておられるとのこと、よかったです。
> 徐々にといった感じです.

そうですね。腰痛はすぐには治りませんね。無理はいけないと聞きました。どうかご自愛いただき、ゆっくりとお付き合い願えれば嬉しいです。


> 以下,具体的に事項について私の考えていることを記しておきます.
> 
>> いくつか疑問が出てきます:
>> 
>> ・B に分類される終わり括弧類と句読点は、二点を除いて振る舞いが同じです。一つ
>> は後ろに和字間隔が来る時です。終わり括弧類の後ろに和字間隔が来た場合は二分詰
>> め、句読点の後ろに和字間隔が来た場合はそのまま。もう一点は、後ろに中点類が来
>> る場合です。終わり括弧類の後ろに中点類が来る場合には、終わり括弧側を二分詰め、
>> つまり中点側の四分が残ります。句読点の後ろに中点類が来る場合には、双方を詰め
>> てベタにします。これらは頻繁なケースではないように思え、それなら終わり括弧類
>> と句読点のルールを一致させて単純化しても良いのではないか、と思うのですが、ど
>> うでしょう?
> 
> 最初に,括弧類と和字間隔,括弧類と中点類の連続
> 
> 括弧類と和字間隔,括弧類と中点類の連続は,多くはありませんが,それなりに
> あります.以下に例を示します.和字間隔を“□”で示す.
>  1)□この問題……
>  注記で括弧で番号をくくり,その後ろを全角アキにする.中点の
>  「句読点」□「括弧」
>  「句読点」・「括弧」
> 括弧で括った用語を全角アキで並べる.この例では中点にする場合もあります.
>  そうなのか?□「では…
> 疑問符,感嘆符の全角アキの後ろに括弧類を配置
> 
> このような場合,括弧類の二分アキをそのままにするとアキ過ぎになります.で
> すので,上のようなルールが考えられたのです.
> 
> ですので,括弧類と和字間隔,括弧類と中点類の連続に特別に詰める規定を採用
> することは意味があります.

よく理解しました。括弧類と中点、和字間隔の詰め、了解です。

一点確認です。下の例ですが、間に和字間隔を挟まない場合は括弧の間が二分空き、挟めば全角空き、という結果で正しいですか?
>  「句読点」□「括弧」



> 次に句読点と和字間隔,括弧類と中点類の連続
> 
> これは木田さんの説明(句読点の後ろに中点類が来る場合には、双方を詰めてベ
> タにする)ではなく,句読点の後ろ二分アキ,中点の前は四分アキ,つまり,そ
> れぞれ全角で並べる.和時間隔の場合も同じで,詰めない.

私の表の誤りです。注記の5を読み違えていました  :(
下に訂正した表を添付しました

> これは,実際に起こる例は,あまり考えられません.ですので,ある意味,どう
> 決めてもいいような問題です.ただし,規則として何か決めないといけないので,
> ある意味で適当な(ある意味,いいかげん,といってもよい)で決めてよいこと
> です.

句読点が終わり括弧類と異なるところは後ろに中点類や和字間隔が来る場合だけですので、もしここをどう決めても良いとしたら、終わり括弧類に揃えるのはどうでしょう?

つまり句読点の後ろに何故か中点類や和字間隔があるようなデータがあったなら、句読点の後ろを二分つめる。こうすることで、句読点を終わり括弧類と同じクラスにすることができます。

これら三つ(cl-02, cl-06, cl-07)は厳格に行頭禁則(つまりどのようなゆるい基準でも禁則)となる三つの文字クラスですので、行の折り返しに対しても同一クラスにすることができそうです。行の折り返しのプロパティは Unicode 中でも独立していますので、このクラス分けが一緒になる必要はないのですが、理解がしやすくなりますね。

> また,これには別の事情があります.JIS X 4051では句点は全角絶対主義です
> (行末の必ず全角でないといけない,これは私は反対しているが,私の参加して
> いない第二次規格で決まった).こうしたこともあり,句点と和字間隔,句点と
> 中点は,括弧類と扱いが別になった.

そういう経緯があるのですね。JLReq では句点の後ろに、始め括弧/終わり括弧/句読点がくる場合には二分つめる(ベタ)になっていますが、X4051 ではこれらも全角になりますか?(調べれば良いのですがオンラインにないので…ズボラしてすみません)

基本は同じにしておいて、句点を必ず全角にするスタイルにしたければ、その場合にクラスを分ければ良いですね。

> 一方,JIS X 4051では,読点は終わり括弧類に含ませているので,扱いは括弧類
> と同じです.JIS X 4051では,終わり括弧類と読点は同じ扱いだが,句点は異な
> る.
> 
> こうした経過のもとで,JLReqでは,読点を独立させた.その際に読点を句点と
> 揃えるために,上のようにしたものです.JLReqでは,この事情は注記にしるし
> てある.(句点全角主義のことは記していない.)
> 
> ですから,句読点と和字間隔,括弧類と中点類の連続を括弧類と同じにする,つ
> まり,括弧類の規則に合わせることは,私は,まったく問題はないと考えていま
> す.
> 
> ただし,行の調整処理を考えると,終わり括弧類と読点は同じ扱いでよいが,句
> 点は調整で詰めたくないので,別扱いにする必要がある.

了解です。

考えてみれば、行の調整のための基準となるようなプロパティが Unicode にあったか、記憶がありません。ICU はどうしているんだろう。石井さん、ご存知?

> さらにいえば,APLの報告書で行の調整処理で詰める調整を採用しない簡略な案
> を考えました.この簡略な案で考えれば,終わり括弧類と読点と句点との差異は
> なくなるので,同じ文字クラスにできる.
> 
> ついではいえば,終わり括弧類と読点と句点では,ルビをはみ出しを掛ける問題
> でも,注記の合印を処理する場合でも,同じ扱いができるので文字クラスとして
> は同じ扱いにできる.

👍

ベースの案はシンプルにして、可能ならより精緻な組版のレベルも作れると良いですね。ただ、このレベルになると複数のスタイルや、もしくは目的別のスタイルがありそう。


>> ・cl-04 区切り約物(疑問符感嘆符)の挙動は D と E の中間で、後ろが英字の場合
>> のみ四分アキです。この場合にもベタにするのは不都合でしょうか? 文章の入力時、
>> 後ろが和字の場合には手で空白を入力し、後ろが英字なら空白を入力しない、という
>> のは次に入力する字種が決まらないと空白を入れるべきかどうかわからないという意
>> 味で、使い心地もあまり良くないような気がします。
> 
> ここも,ある意味,どちらでもいい事項.そもそも,“cl-04区切り約物”(疑
> 問符,感嘆符)の後ろは,通常は和字間隔です.和字間隔が入らない場合は,文
> 章の途中に“cl-04区切り約物”が入る場合です.以下に例を示す.
>  それってヤギ,それともヒツジ?と,私は気になった
>  大化けするかも?っていう
> この場合,以下のよう記すことができます.
>  意味不明(?)な言葉
> 
> つまり,実際の用例はありますが,あまり一般的でない.しかも,それが英字に
> なるケースはほとんどない.

そう思います。


ところで、私は “cl-04区切り約物”(疑問符,感嘆符)の後ろ、和字間隔だとちょっと余韻が長すぎるように感じられて、欧文空白を入れることも多いです。問いの答えを待っていない感じです。現代がより忙しくなったということでしょうか。

 明日の午後ですね。雨が…		# 句点

 明日の午後ですね?雨が…  # 間隔なし。実はあまり違和感がない。念押し

 明日の午後ですね? 雨が…	# 和文疑問符と欧文間隔。念押しもしくは即答を期待

 明日の午後ですね? 雨が… # 和文疑問符と和字間隔。答えをゆっくり待っている


>> ・隣接する間隔文字が和文か欧文かで動作の異なる場合が一つだけあります。始め括
>> 弧の前に間隔文字が来たり、終わり括弧の後ろに間隔文字が来る場合、和文の場合の
>> み半角詰め。この差は合理的でしょうか?
> 
> 和文の括弧類に和字間隔が連続する場合は,用例もあるし,括弧類や句読点の前
> 後の二分アキを詰めることは前述したように意味があります.
> 
> 次に括弧類や句読点の前後の欧文間隔が配置されるケースは,ちょっと私は用例
> が考えられない.ですので,ある意味で適当に決めればよい事項です.

了解です。和字間隔とは同じに扱えないことを理解しましたので、その場合は無理に欧文間隔の挙動を和字間隔に近づける必要はなさそうです。そのままにしましょう。


>> ・もしかすると Unicode への拡張を考えるとこれが一番影響が大きいかもしれません。
>> E は英字との間に四分アキを要求します。E に含まれるクラス名を見るとどれも音価
>> をもった文字のように見えるのですが、これは、和文単語と英字が連続する場合、英
>> 字側から見た単語の区切りとして、空きがその間に来ることを要求するのだと考える
>> とすんなり理解できます。そのように理解するとき、cl-19 に含まれる大量の記号文
>> 字が気になります。これらの記号も英字との間を四分アキにするのが適当でしょう
>> か? 例えば丸数字 ① で箇条書きにするような場合、文頭に和字が来るか英字が来
>> るかで文頭が揃わない、など不都合が色々考えられそうです。逆に、cl-19 の記号と
>> 英字の間に自動的な四分空きがあるべきケースにはどのようなものがあるでしょう
>> か?
> 
> 和文と英字との間隔の問題
> 
> この問題は,意味上の必要からでてきた問題ではないと思います.確かに欧文は,
> 単語間にスペースを入れます.日本語ではいれません.しかし,漢字仮名の中に
> 英語の単語,あるいは複数の語句の連続が挿入されたからといって,漢字と英語
> の間にスペースをいれて単語を区別する必要性はありません.
> 
> なぜなら,日本語の漢字仮名混じり文では,字間をベタにしていても,文字種で
> 単語の区切りがわかるのです.つまり,漢字が単語の単位を示しているからです.
> ですから,仮名の多い文章では,句読点や分かち書きが必要になる例はないわけ
> ではないが,一般的にいって語と語の区切りにスペースを入れる必要性は少ない
> のです.これは,日本語の中に片仮名や英字,英字の単語が挿入されても同じで,
> スペースを入れなくても,単語に分けられるのです.

確かに和文側から見るとそうなのですが、英文側から見ると、スペースが空いていない = 単語が区切れていない、ですので、英文側からの視点でスペースが必要なのではないでしょうか? ただし、英文側から見ると、手で空白を入れるのもまた自然なことですね。


> ついでにいえば,漢文は,ちょっと事情が異なり,単語を区別できないではない
> か,それでも語間を空けないのはなぜか,という問題はあります.これは,原則,
> 漢文では1字1字が一般に1語だからということのようです.でも,一般人にとっ
> ては,とても読めない,そこで,句読点を入れる必要があるのです.

そもそも中国語(古代の文語?)ですのでね。

脇道ですが漢文というのは面白い技術ですね。英語に例えれば、英語という言語を理解することなしに、読む順番を制御する記号を入れることで日本語として読めるようにしようという技ですからね。

さらに脇道ですが、考えてみれば学校英語はこれに近いのかもしれませんね。英訳和訳という翻訳技術を通じて、英語を日本語を通じて理解させようとしますので、この漢文の伝統が生きている感じです。


> ではなぜ和文と英文との字間を空けるかは,もっぱら見た目のバランスの問題で
> す.文字の設計が異なるからです.和文は,全角の台に対し,文字により異なり
> ますが,ある程度の余白があります.これに対し,欧文では,その上下にはアキ
> はありますが,その左右には,ごく僅かのアキしかありません.しかも,そのご
> くわずかのアキは,欧文を並べた際に単語の字間均一に見えるように設計されて
> います.
> 
> この文字の設計の違いが,和文と欧文をベタ組で並べた際に,和文の字間に対し,
> 和文と欧文の間だけが詰まった印象を与えるので,和文と欧文の字間を四分アキ
> にしたのです.
> 
> ですから,見た目のバランスが問題ですから,アキは四分でなくてもよいので
> (活字では,材料の関係で,四分が選ばれたのです),活字組版では,四分アキ
> にしないで,二分アキにした例もありました.また,ベタ組にした例もけっこう
> ありましたし,それでも読めるという意味では読めました.ただ,“体裁よくな
> いな”と言われる恐れはありますが,
> 
> このアキはフォントの設計もよるでしょう.最近の印刷物を見ていると,四分よ
> り狭い組版をよく見かけますし,ベタ組でも,文字の並びによっては問題ない
> ケースもありますが,逆に文字の組み合わせで,ベタ組だと,えらく詰まった
> ケースもあり,悩ましい問題です.
> 
> 一つの考え方として,ある限られた欧文,それと漢字と仮名だけの字間を空ける
> 処理ができるようにして,あとは“知らん”(つまりベタ組)といってもよいか
> もしれない.

確かに、記号ではない発音できる文字+もしあれば少数の追加文字、についてはアキを定義して、そうでない場合には放っておく方が、少なくとも理解・管理がしやすいように思います。

アキを開ける対象として、漢字(Ideograph)と仮名は当然として、他に必要な文字はあるでしょうかね。韃靼文字など、中国の漢字の派生的な文字である and/or 全角である and/or 単語間に空白がない文字、これは仮名もそうですね、は入れるのが適当に思えます。きちんとリストできるか見てみます。

現在 cl-19 に入っている全ての約物、記号は cl-19 から除外して良いでしょうか?


––––
間違いがあったので、先に送った字間の表を更新しました。また、変更の提案てんは赤で示しています



木田

>> 敏先生、この辺り、ご無理のない範囲でご教授いただけると嬉しいです。
>> 
>> 木田
>> 
>> –––––––––––
>> 表を整理した方法
>> 
>> 1) 「…中の文字」というコンテキストに依存した文字クラスを省略
>> 2) 今までの議論で削除することになったクラス(cl-12, 13 前置後置省略記号)を省
>> 略
>> 3) 数値以外の情報を省略。注記に言葉で表されている空き量を表の中に
>> 4) 動作が全く同じ文字クラス同士はひとまとめに
>> 5) デジタルフォントにおいて、約物の前後の空白がグリフに含まれている場合、その
>> グリフからの修正値に変更。それらはクラス名を「…グリフ」と変えてあります。こ
>> れらは修正値がマイナスになります。
>> –––––––––––

Received on Monday, 22 March 2021 01:00:31 UTC