Re: JLReq のクラスと Eric の提案クラスとの比較

敏先生、ありがとうございます。

> ただし,本来的にラテン文字をボディの大きさに合わせて設計する必要はないと
> 考えてよく,必要なら和文に合うデザインのフォントを選べばよいことである.

縦組みで全角でない通常の英字を正立で使うと中心線が揃わなくてガタガタするという問題があったような記憶があるのですが、その点はどうでしょう?

> となれば,縦組にあっては,a, b, cのいずれかであってよいと考えられる.こ
> うすれば,縦組と横組でもラテン文字は,全てcl-19といってよく,文字の向き
> をどうするかは,それは指定によるとすればよい.


全てcl-27、の間違い?

指定のない場合の動作は a でしょうか?

> ただし,前述したように約物は字形が異なるので,ここで述べた方針では処理で
> きない.横組でも縦組でも,同じ名称であるコンマやピリオド,パーレンは,cl
> -19に含まれる約物と,それ以外の文字クラスに含まれる約物の2つを必要とする.
> ですので,横組だからcl-19,縦組だからcl-19以外の文字クラスというわけには
> いかない.

Eric の提案でも縦横でクラスを変えているのはほとんど通常の文字のようです。JLReq で cl-19 と cl-27 に属するものや、cl-27 のみ(全角分離後を含め)のもの。
cl-19/cl-27
552
A
R
westernChar
ideographic
←
ギリシア大文字ALPHA
Α
U+0391
GREEK CAPITAL LETTER ALPHA
/プロポーショナル
cl-27
895
Na
R
westernChar
ideographic
←
単価記号,アットマーク
@
U+0040
COMMERCIAL AT
プロポーショナル
cl-27
978
N
R
westernChar
ideographic
←
グレーブアクセント付きA
À
U+00C0
LATIN CAPITAL LETTER A WITH GRAVE
プロポーショナル

ただ、約物でも縦横でクラスを変えているものもありますね。
cl-08/cl-27
68
A
R
inseparable_emDash
ideographic
←
ダッシュ(全角)/ダッシュ
—
U+2014
EM DASH
処理系によっては,U+2015 (HORIZONTAL BAR)にも,同様の振る舞いを実装しているものもある/プロポーショナル
cl-08/cl-27
69
A
R
inseparable_twoDotLeader
ideographic
←
二点リーダ
‥
U+2025
TWO DOT LEADER
/プロポーショナル
cl-08/cl-27
70
A
R
inseparable_ellipsis
ideographic
←
三点リーダ
…
U+2026
HORIZONTAL ELLIPSIS
/プロポーショナル

cl-19/cl-27
667
A
U
westernChar
ideographic
←
双柱
‖
U+2016
DOUBLE VERTICAL LINE
/プロポーショナル
cl-19/cl-27
668
A
U
westernChar
ideographic
←
ダガー
†
U+2020
DAGGER
/プロポーショナル
cl-19/cl-27
669
A
U
westernChar
ideographic
←
ダブルダガー
‡
U+2021
DOUBLE DAGGER
/プロポーショナル
cl-19/cl-27
670
A
R
westernChar
ideographic
←
ビュレット
•
U+2022
BULLET
/プロポーショナル
cl-19/cl-27
671
N
U
westernChar
ideographic
←
アステリズム
⁂
U+2042
ASTERISM
/プロポーショナル
cl-19/cl-27
672
N
U
westernChar
ideographic
←
ダブルアステ
⁑
U+2051
TWO ASTERISKS ALIGNED VERTICALLY
/プロポーショナル
cl-19/cl-27
699
N
R
westernChar
ideographic
←
空白記号
␣
U+2423
OPEN BOX
/プロポーショナル
cl-26
861
Na
R
justifyingSpace
ideographic
←

 
U+0020
SPACE

cl-27
864
Na
R
westernChar
ideographic
←
感嘆符
!
U+0021
EXCLAMATION MARK
プロポーショナル
cl-27
865
Na
R
westernChar
ideographic
←
引用符,クォーテーションマーク
'"'
U+0022
QUOTATION MARK
プロポーショナル
cl-27
866
Na
R
westernChar
ideographic
←
番号記号,井げた
#
U+0023
NUMBER SIGN
プロポーショナル
cl-27
867
Na
R
westernChar
ideographic
←
ドル記号
$
U+0024
DOLLAR SIGN
プロポーショナル
cl-27
868
Na
R
westernChar
ideographic
←
パーセント
%
U+0025
PERCENT SIGN
プロポーショナル
cl-27
869
Na
R
westernChar
ideographic
←
アンパサンド
&
U+0026
AMPERSAND
プロポーショナル
cl-27
870
Na
R
westernChar
ideographic
←
アポストロフィ
'
U+0027
APOSTROPHE
プロポーショナル
cl-27
871
Na
R
westernChar
ideographic
←
始め小括弧,始め丸括弧
(
U+0028
LEFT PARENTHESIS
プロポーショナル
cl-27
872
Na
R
westernChar
ideographic
←
終わり小括弧,終わり丸括弧
)
U+0029
RIGHT PARENTHESIS
プロポーショナル
cl-27
873
Na
R
westernChar
ideographic
←
星印,アステリスク
*
U+002A
ASTERISK
プロポーショナル
cl-27
874
Na
R
westernChar
ideographic
←
正符号,加算記号
+
U+002B
PLUS SIGN
プロポーショナル
cl-27
875
Na
R
westernChar
ideographic
←
コンマ
,
U+002C
COMMA
プロポーショナル
cl-27
876
Na
R
westernChar
ideographic
←
ハイフンマイナス
-
U+002D
HYPHEN-MINUS
プロポーショナル
cl-27
877
Na
R
westernChar
ideographic
←
ピリオド
.
U+002E
FULL STOP
プロポーショナル
cl-27
878
Na
R
westernChar
ideographic
←
斜線
/
U+002F
SOLIDUS
プロポーショナル

また下の例は唯一、縦横ではなくて、それが日本語かどうかで分けています。
cl-02/cl-27
34
A
R
closingBracket_other
←
westernChar
右シングル引用符,右シングルクォーテーションマーク
’
U+2019
RIGHT SINGLE QUOTATION MARK
横組で使用/プロポーショナル


U+0028 / U+FF08 (LEFT PARENTHESIS) のように和文と欧文でコードポイントが分かれていると振る舞いが一意に決まってやりやすいのですが、そうでない約物は難しくなりますね。


上の表を見ていて気がついたのですが、Eric の提案では例えば欧文感嘆符 ! の字間クラスを横書きでは westernChar、縦書きでは ideographic にしています。しかしこの文字の Vertical Orientation の属性(Unicode で定めている)は他の欧文と同じで R、つまり横倒し。横倒しにしてかつ字間を cl-19 的に扱うのはヘンテコですよね。これは Eric に聞くネタの一つですね。

木田

> 2020/11/23 18:52、Kobayashi Toshi <binn@k.email.ne.jp>のメール:
> 
> 木田泰夫 様
> みなさま
> 
>  小林 敏 です.
> 
> データ作成,ありがとうございます.
> 
> あたっているかどうかわかりませんが,拝見して,私の理解した問題を以下に記
> しておきます.
> 
> まず,総括的な問題,ラテン文字をどう扱うかです.JLReqでは,欧⽂⽤⽂字
> (cl-27)と漢字等(cl-19)の両方に含まれています.これは,ある意味で混乱
> の元であり,何か整理できないか,と考えるのは意味がある.
> 
> ただし,a-zA-Z0-9の文字とコンマ・ピリオド,パーレンなどの約物では扱いが
> 異なるので,まずa-zA-Z0-9の文字だけに限定して考えてみます.
> 
> 横組の場合は,原則としてcl-27で扱えばよい.(ただし,流通している本やWeb
> ではcl-19で処理している例もあるが,これは望ましくないと考えてよい.)
> 
> 縦組の場合,以下のような組み合わせがありえます.
> 
> a すべてcl-27として扱う(向きは全て時計回りに90度回転,以下“横転”とい
> う)
> b すべてcl-27として扱う(向きは正常な向き,以下“正常”という)
> c すべてcl-27として扱うが,状況により正常な向き,横転した向きにする.
> d 正常な向きはcl-19,横転する場合はcl-27
> e すべてcl-19とし,向きは正常
> f すべてcl-19とし,向きは横転
> g すべてcl-19とし,向きは正常と横転との両方
> 
> DTPなどでは,dで処理している場合が多い(cで処理している例もある).f, g
> の例はないでしょう.
> 活字組版でもdであるが,正常な向きにするのはc-16では面倒なので,cl-27,つ
> まり全角の台に鋳込んだ活字を使用していた.
> 
> ところで,cl-19とcl-27では,字面は同じか異なるか,という問題があります.
> これは異なるともいえるし,同じでよいともいえる.活字の場合は,同じでよか
> ったが,台が全角だからということで,台に応じた字形にしたものが作成される
> ようになった.DTPでも,これにならいcl-19とcl-27では,一般に字形は異なる.
> 
> ただし,本来的にラテン文字をボディの大きさに合わせて設計する必要はないと
> 考えてよく,必要なら和文に合うデザインのフォントを選べばよいことである.
> (この点で約物と文字との差が出てくる,cl-27に含まれる約物と,それ以外の
> 文字クラスに含まれるものでは字形を変えないといけない.)
> 
> となれば,縦組にあっては,a, b, cのいずれかであってよいと考えられる.こ
> うすれば,縦組と横組でもラテン文字は,全てcl-19といってよく,文字の向き
> をどうするかは,それは指定によるとすればよい.
> 
> ただし,前述したように約物は字形が異なるので,ここで述べた方針では処理で
> きない.横組でも縦組でも,同じ名称であるコンマやピリオド,パーレンは,cl
> -19に含まれる約物と,それ以外の文字クラスに含まれる約物の2つを必要とする.
> ですので,横組だからcl-19,縦組だからcl-19以外の文字クラスというわけには
> いかない.
> 
> 以上です.
> 
>  木田泰夫 さんwrote
> 
>> みなさま、やっとできました(疲!)
>> 
>> JLReq のクラスと Eric 提案のクラスの比較データを作りました。タブ区切りファイ
>> ルなので、スプレッドシートにでも読み込ませると見やすいと思います。
>> 
>> 私はここで息が切れたので、みなさま分析をぜひ。

Received on Tuesday, 24 November 2020 00:54:49 UTC