- From: 木田泰夫 <kida@mac.com>
- Date: Tue, 24 Nov 2020 09:54:24 +0900
- To: Kobayashi Toshi <binn@k.email.ne.jp>
- Cc: "public-i18n-japanese@w3.org" <public-i18n-japanese@w3.org>
- Message-Id: <F88029FA-83A8-4085-87B5-22BFD6E4F5C0@mac.com>
敏先生、ありがとうございます。 > ただし,本来的にラテン文字をボディの大きさに合わせて設計する必要はないと > 考えてよく,必要なら和文に合うデザインのフォントを選べばよいことである. 縦組みで全角でない通常の英字を正立で使うと中心線が揃わなくてガタガタするという問題があったような記憶があるのですが、その点はどうでしょう? > となれば,縦組にあっては,a, b, cのいずれかであってよいと考えられる.こ > うすれば,縦組と横組でもラテン文字は,全てcl-19といってよく,文字の向き > をどうするかは,それは指定によるとすればよい. 全てcl-27、の間違い? 指定のない場合の動作は a でしょうか? > ただし,前述したように約物は字形が異なるので,ここで述べた方針では処理で > きない.横組でも縦組でも,同じ名称であるコンマやピリオド,パーレンは,cl > -19に含まれる約物と,それ以外の文字クラスに含まれる約物の2つを必要とする. > ですので,横組だからcl-19,縦組だからcl-19以外の文字クラスというわけには > いかない. Eric の提案でも縦横でクラスを変えているのはほとんど通常の文字のようです。JLReq で cl-19 と cl-27 に属するものや、cl-27 のみ(全角分離後を含め)のもの。 cl-19/cl-27 552 A R westernChar ideographic ← ギリシア大文字ALPHA Α U+0391 GREEK CAPITAL LETTER ALPHA /プロポーショナル cl-27 895 Na R westernChar ideographic ← 単価記号,アットマーク @ U+0040 COMMERCIAL AT プロポーショナル cl-27 978 N R westernChar ideographic ← グレーブアクセント付きA À U+00C0 LATIN CAPITAL LETTER A WITH GRAVE プロポーショナル ただ、約物でも縦横でクラスを変えているものもありますね。 cl-08/cl-27 68 A R inseparable_emDash ideographic ← ダッシュ(全角)/ダッシュ — U+2014 EM DASH 処理系によっては,U+2015 (HORIZONTAL BAR)にも,同様の振る舞いを実装しているものもある/プロポーショナル cl-08/cl-27 69 A R inseparable_twoDotLeader ideographic ← 二点リーダ ‥ U+2025 TWO DOT LEADER /プロポーショナル cl-08/cl-27 70 A R inseparable_ellipsis ideographic ← 三点リーダ … U+2026 HORIZONTAL ELLIPSIS /プロポーショナル cl-19/cl-27 667 A U westernChar ideographic ← 双柱 ‖ U+2016 DOUBLE VERTICAL LINE /プロポーショナル cl-19/cl-27 668 A U westernChar ideographic ← ダガー † U+2020 DAGGER /プロポーショナル cl-19/cl-27 669 A U westernChar ideographic ← ダブルダガー ‡ U+2021 DOUBLE DAGGER /プロポーショナル cl-19/cl-27 670 A R westernChar ideographic ← ビュレット • U+2022 BULLET /プロポーショナル cl-19/cl-27 671 N U westernChar ideographic ← アステリズム ⁂ U+2042 ASTERISM /プロポーショナル cl-19/cl-27 672 N U westernChar ideographic ← ダブルアステ ⁑ U+2051 TWO ASTERISKS ALIGNED VERTICALLY /プロポーショナル cl-19/cl-27 699 N R westernChar ideographic ← 空白記号 ␣ U+2423 OPEN BOX /プロポーショナル cl-26 861 Na R justifyingSpace ideographic ← U+0020 SPACE cl-27 864 Na R westernChar ideographic ← 感嘆符 ! U+0021 EXCLAMATION MARK プロポーショナル cl-27 865 Na R westernChar ideographic ← 引用符,クォーテーションマーク '"' U+0022 QUOTATION MARK プロポーショナル cl-27 866 Na R westernChar ideographic ← 番号記号,井げた # U+0023 NUMBER SIGN プロポーショナル cl-27 867 Na R westernChar ideographic ← ドル記号 $ U+0024 DOLLAR SIGN プロポーショナル cl-27 868 Na R westernChar ideographic ← パーセント % U+0025 PERCENT SIGN プロポーショナル cl-27 869 Na R westernChar ideographic ← アンパサンド & U+0026 AMPERSAND プロポーショナル cl-27 870 Na R westernChar ideographic ← アポストロフィ ' U+0027 APOSTROPHE プロポーショナル cl-27 871 Na R westernChar ideographic ← 始め小括弧,始め丸括弧 ( U+0028 LEFT PARENTHESIS プロポーショナル cl-27 872 Na R westernChar ideographic ← 終わり小括弧,終わり丸括弧 ) U+0029 RIGHT PARENTHESIS プロポーショナル cl-27 873 Na R westernChar ideographic ← 星印,アステリスク * U+002A ASTERISK プロポーショナル cl-27 874 Na R westernChar ideographic ← 正符号,加算記号 + U+002B PLUS SIGN プロポーショナル cl-27 875 Na R westernChar ideographic ← コンマ , U+002C COMMA プロポーショナル cl-27 876 Na R westernChar ideographic ← ハイフンマイナス - U+002D HYPHEN-MINUS プロポーショナル cl-27 877 Na R westernChar ideographic ← ピリオド . U+002E FULL STOP プロポーショナル cl-27 878 Na R westernChar ideographic ← 斜線 / U+002F SOLIDUS プロポーショナル また下の例は唯一、縦横ではなくて、それが日本語かどうかで分けています。 cl-02/cl-27 34 A R closingBracket_other ← westernChar 右シングル引用符,右シングルクォーテーションマーク ’ U+2019 RIGHT SINGLE QUOTATION MARK 横組で使用/プロポーショナル U+0028 / U+FF08 (LEFT PARENTHESIS) のように和文と欧文でコードポイントが分かれていると振る舞いが一意に決まってやりやすいのですが、そうでない約物は難しくなりますね。 上の表を見ていて気がついたのですが、Eric の提案では例えば欧文感嘆符 ! の字間クラスを横書きでは westernChar、縦書きでは ideographic にしています。しかしこの文字の Vertical Orientation の属性(Unicode で定めている)は他の欧文と同じで R、つまり横倒し。横倒しにしてかつ字間を cl-19 的に扱うのはヘンテコですよね。これは Eric に聞くネタの一つですね。 木田 > 2020/11/23 18:52、Kobayashi Toshi <binn@k.email.ne.jp>のメール: > > 木田泰夫 様 > みなさま > > 小林 敏 です. > > データ作成,ありがとうございます. > > あたっているかどうかわかりませんが,拝見して,私の理解した問題を以下に記 > しておきます. > > まず,総括的な問題,ラテン文字をどう扱うかです.JLReqでは,欧⽂⽤⽂字 > (cl-27)と漢字等(cl-19)の両方に含まれています.これは,ある意味で混乱 > の元であり,何か整理できないか,と考えるのは意味がある. > > ただし,a-zA-Z0-9の文字とコンマ・ピリオド,パーレンなどの約物では扱いが > 異なるので,まずa-zA-Z0-9の文字だけに限定して考えてみます. > > 横組の場合は,原則としてcl-27で扱えばよい.(ただし,流通している本やWeb > ではcl-19で処理している例もあるが,これは望ましくないと考えてよい.) > > 縦組の場合,以下のような組み合わせがありえます. > > a すべてcl-27として扱う(向きは全て時計回りに90度回転,以下“横転”とい > う) > b すべてcl-27として扱う(向きは正常な向き,以下“正常”という) > c すべてcl-27として扱うが,状況により正常な向き,横転した向きにする. > d 正常な向きはcl-19,横転する場合はcl-27 > e すべてcl-19とし,向きは正常 > f すべてcl-19とし,向きは横転 > g すべてcl-19とし,向きは正常と横転との両方 > > DTPなどでは,dで処理している場合が多い(cで処理している例もある).f, g > の例はないでしょう. > 活字組版でもdであるが,正常な向きにするのはc-16では面倒なので,cl-27,つ > まり全角の台に鋳込んだ活字を使用していた. > > ところで,cl-19とcl-27では,字面は同じか異なるか,という問題があります. > これは異なるともいえるし,同じでよいともいえる.活字の場合は,同じでよか > ったが,台が全角だからということで,台に応じた字形にしたものが作成される > ようになった.DTPでも,これにならいcl-19とcl-27では,一般に字形は異なる. > > ただし,本来的にラテン文字をボディの大きさに合わせて設計する必要はないと > 考えてよく,必要なら和文に合うデザインのフォントを選べばよいことである. > (この点で約物と文字との差が出てくる,cl-27に含まれる約物と,それ以外の > 文字クラスに含まれるものでは字形を変えないといけない.) > > となれば,縦組にあっては,a, b, cのいずれかであってよいと考えられる.こ > うすれば,縦組と横組でもラテン文字は,全てcl-19といってよく,文字の向き > をどうするかは,それは指定によるとすればよい. > > ただし,前述したように約物は字形が異なるので,ここで述べた方針では処理で > きない.横組でも縦組でも,同じ名称であるコンマやピリオド,パーレンは,cl > -19に含まれる約物と,それ以外の文字クラスに含まれる約物の2つを必要とする. > ですので,横組だからcl-19,縦組だからcl-19以外の文字クラスというわけには > いかない. > > 以上です. > > 木田泰夫 さんwrote > >> みなさま、やっとできました(疲!) >> >> JLReq のクラスと Eric 提案のクラスの比較データを作りました。タブ区切りファイ >> ルなので、スプレッドシートにでも読み込ませると見やすいと思います。 >> >> 私はここで息が切れたので、みなさま分析をぜひ。
Received on Tuesday, 24 November 2020 00:54:49 UTC