- From: 木田泰夫 <kida@mac.com>
- Date: Mon, 19 Jul 2021 12:51:03 +0900
- To: JLReq TF 日本語 <public-i18n-japanese@w3.org>
- Message-Id: <E27A4EC4-2A36-4A09-B2D2-FDBFA066D316@mac.com>
JLReq TF の皆さま、 前のメールでは、AJ1 (vert) と UAX#50 の食い違いを見たわけですが、実はほとんどの文字の縦横は、vert ではなくてアプリケーションの動作によって決定されます。ゆえ、このメールではアプリケーションの動作の非互換性を分析してみました。 AJ1 vert と違い、こちらはアプリケーションの動作ですから、フォントの仕様には関係がない………なら話が単純で良いのですが、残念ながら影響があります。というのは、縦書きで文字が縦になるか横になるかで、その文字のグリフに対して何が期待されているかが違ってくるからです。例えば、ギリシア文字は UAX#50 では外国語と見て横倒し、InDesign でも欧文書体だと横倒しですが、和文書体だと「α線」のように全角文字が記号的に使われているという前提で正立させます。フォントを UAX#50 に沿わせる場合は和文書体でも(UAX#50はテキストや書体の言語を区別しません)ギリシア文字は横倒しとなり、よってプロポーショナルなグリフの出てくることが期待されるでしょう。もちろん全角のままでも良いのですがプロフェッショナルな結果とはみなされないでしょう。つまり UAX#50 の指定するアプリケーションの動作は間接的にですがフォントにも影響があることになります。 下に具体的な分析がありますが、まず全体的な感想を。 InDesign が文字を正立させ、UAX#50 が横転させている場合は、大きな傾向としてですが、InDesign 側が、理由があって正立というより、単にJIS文字は全角、全角は正立、といった過去のレガシーを引きずっているだけの例が多いように思えます。ただし、外国語文字や数学記号でありながら和文で正立させる使い方が確立しているといった、理由の見える例もあります。反対に、InDesign で横転、UAX#50 が正立の動作になるケースは文字ごとに色々で統一的な感想はありません。 また、どちらかに統一してさえいればどちらでも良い、というケースは多いと思いました。 縦横の議論には関係ありませんが、そもそも、和文フォントがこれらの文字を持っている意味はどこにあるのか、考えさせられる例も多いように思います。フォントの大きな役目の一つは統一的なスタイルの提供でしょう。特に現代の国際化システムにおいて、多数の外国語、数学記号、その他の記号類などが和文フォントの中に含まれている価値はどこにあるのか、考え直してみても良いのかもしれません。 フォント開発者の方々にとって、遅かれ早かれ判断しなければならないのは、AJ1 のままで行くか、UAX#50 の期待に沿ってゆくのか、ということでしょう。明日のミーティングでは、結局はこの判断をしなければならないことを頭の隅に入れつつ、文字ごとの議論をして行ければと思っています。 木田 ––––––––––– さて、以下はアプリケーション動作の具体的な比較です。 縦書きの典型的で重要な分野は書籍ですから、一方はその代表としての InDesign、もう片方は UAX#50 の期待する典型的な動作、この二つの比較をしました。これらのアプリケーションは下図のような動作をします。 つまり、アプリケーションが R だと思えば、vert に相談することなく横倒しになります。R 以外なら vert があればその字形、なければ正立です。InDesign では上にちらと触れたように、和文フォントなら U、そうでないなら R、と縦横がフォントによって変化するコードポイントがありますが、下の分析では我々が最も興味を持つ和文フォントのケースを比較しています。vert のあるなしは、AJ1 を判断に使いました。 石井さん、Nat さん、この分析でもし間違っているところがあったらぜひ指摘してください。特に、文字方向の計算は実際にアプリケーションを使ってみてどうか、ではなく、聞いている動作アルゴリズムによっていますので、実際と異なる可能性もあると思います。 ––––––––––– まずは InDesign で正立するが、UAX#50 では横転する文字たちです。 上で例として挙げたギリシア文字とキリル文字。外国語文字ですから UAX#50 では横転、InDesign ではフォントが和文なら全角文字が記号的に使われるとみて正立。数が多いので代表的な文字のみ下に示しました。 Unicode 文字 文字名 Unicode character name UAX50 動作 InD 動作 和文 InD 動作 欧文 GC UAX11 Unicode Block UAX50 InD U+0391 Α ギリシア大文字ALPHA GREEK CAPITAL LETTER ALPHA R U R L& A Greek and Coptic R UR U+0410 А キリール大文字A CYRILLIC CAPITAL LETTER A R U R L& A Cyrillic R UR 次は算術記号。InDesign でこれらを正立させていますが、これらの文字は数式とともに使われ、行の方向に方向性を持った文字が多いですので基本横倒しなんじゃないんでしょうか。ただし文字によっては方向が違うと意味が違ってくるものがあります(e.g. 真部分集合 ⊂ と共通集合 ∩)。これらは横書きを前提とした文字と言い換えても良いと思います。それらを縦書きでどう扱うべきか、そもそも縦書きで使うべきかなど、きちんと考える必要がありそうです。 Unicode 文字 文字名 Unicode character name UAX50 動作 InD 動作 和文 InD 動作 欧文 GC UAX11 Unicode Block UAX50 InD U+FF0D - 全角負符号 減算記号 FULLWIDTH MINUS SIGN R U U Pd F Halfwidth and Fullwidth Forms R U U+FF1C < 全角不等号(より小) FULLWIDTH LESS-THAN SIGN R U U Sm F Halfwidth and Fullwidth Forms R U U+FF1E > 全角不等号(より大) FULLWIDTH GREATER-THAN SIGN R U U Sm F Halfwidth and Fullwidth Forms R U U+2208 ∈ 属する ELEMENT OF R U R Sm A Mathematical Operators R UR U+2209 ∉ 要素の否定 元の否定 NOT AN ELEMENT OF R U R Sm N Mathematical Operators R UR U+220B ∋ 元として含む CONTAINS AS MEMBER R U R Sm A Mathematical Operators R UR U+221D ∝ 比例 PROPORTIONAL TO R U R Sm A Mathematical Operators R UR U+2225 ∥ 平行 PARALLEL TO R U R Sm A Mathematical Operators R UR U+2226 ∦ 平行の否定 NOT PARALLEL TO R U R Sm N Mathematical Operators R UR U+2227 ∧ 及び(合接) LOGICAL AND R U R Sm A Mathematical Operators R UR U+2228 ∨ 又は(離接) LOGICAL OR R U R Sm A Mathematical Operators R UR U+2229 ∩ 共通集合 INTERSECTION R U R Sm A Mathematical Operators R UR U+222A ∪ 合併集合 UNION R U R Sm A Mathematical Operators R UR U+223D ∽ 相似 REVERSED TILDE R U R Sm A Mathematical Operators R UR U+2243 ≃ 漸進的に等しい ホモトープ ASYMPTOTICALLY EQUAL TO R U R Sm N Mathematical Operators R UR U+2245 ≅ 同形 APPROXIMATELY EQUAL TO R U R Sm N Mathematical Operators R UR U+2248 ≈ 近似的に等しい 同相 ALMOST EQUAL TO R U R Sm A Mathematical Operators R UR U+2252 ≒ ほとんど等しい APPROXIMATELY EQUAL TO OR THE IMAGE OF R U R Sm A Mathematical Operators R UR U+2260 ≠ 等号否定 NOT EQUAL TO R U R Sm A Mathematical Operators R UR U+2261 ≡ 常に等しい 合同 IDENTICAL TO R U R Sm A Mathematical Operators R UR U+2262 ≢ 合同否定 NOT IDENTICAL TO R U R Sm N Mathematical Operators R UR U+2266 ≦ より小さいか又は等しい LESS-THAN OVER EQUAL TO R U R Sm A Mathematical Operators R UR U+2267 ≧ より大きいか又は等しい GREATER-THAN OVER EQUAL TO R U R Sm A Mathematical Operators R UR U+226A ≪ 非常に小さい MUCH LESS-THAN R U R Sm A Mathematical Operators R UR U+226B ≫ 非常に大きい MUCH GREATER-THAN R U R Sm A Mathematical Operators R UR U+2276 ≶ 小さいか大きい LESS-THAN OR GREATER-THAN R U R Sm N Mathematical Operators R UR U+2277 ≷ 大きいか小さい GREATER-THAN OR LESS-THAN R U R Sm N Mathematical Operators R UR U+2282 ⊂ 真部分集合 SUBSET OF R U R Sm A Mathematical Operators R UR U+2283 ⊃ 真部分集合(逆方向) SUPERSET OF R U R Sm A Mathematical Operators R UR U+2286 ⊆ 部分集合 SUBSET OF OR EQUAL TO R U R Sm A Mathematical Operators R UR U+2287 ⊇ 部分集合(逆方向) SUPERSET OF OR EQUAL TO R U R Sm A Mathematical Operators R UR U+22A5 ⊥ 垂直 UP TACK R U R Sm A Mathematical Operators R UR U+2213 ∓ 負又は正符号 MINUS-OR-PLUS SIGN R U R Sm N Mathematical Operators R UR U+22BF ⊿ 直角三角 RIGHT TRIANGLE R U R Sm A Mathematical Operators R UR U+29BF ⦿ 丸中黒 CIRCLED BULLET R U R Sm N Miscellaneous Mathematical Symbols-B R UR U+221A √ 根号 SQUARE ROOT R U R Sm A Mathematical Operators R UR U+221F ∟ ファクトリアル 直角 RIGHT ANGLE R U R Sm A Mathematical Operators R UR U+222B ∫ 積分記号 INTEGRAL R U R Sm A Mathematical Operators R UR U+222C ∬ 2重積分記号 DOUBLE INTEGRAL R U R Sm A Mathematical Operators R UR U+29FA ⧺ 2プラス DOUBLE PLUS R U R Sm N Miscellaneous Mathematical Symbols-B R UR U+29FB ⧻ 3プラス TRIPLE PLUS R U R Sm N Miscellaneous Mathematical Symbols-B R UR U+2200 ∀ すべての(普通限定子) FOR ALL R U R Sm A Mathematical Operators R UR U+2202 ∂ デル ラウンドディー PARTIAL DIFFERENTIAL R U R Sm A Mathematical Operators R UR U+2203 ∃ 存在する(存在限定子) THERE EXISTS R U R Sm A Mathematical Operators R UR U+2205 ∅ 空集合 EMPTY SET R U R Sm N Mathematical Operators R UR U+2207 ∇ ナブラ NABLA R U R Sm A Mathematical Operators R UR U+2212 − 負符号 減算記号 MINUS SIGN R U R Sm N Mathematical Operators R UR U+2220 ∠ 角 ANGLE R U R Sm A Mathematical Operators R UR U+222E ∮ 経路積分記号 CONTOUR INTEGRAL R U R Sm A Mathematical Operators R UR その他の文字で、InDesign だと正立、UAX#50 に沿うと横転となるものたち。オングストロームは数学的記号ですが、単位記号として縦書きで正立で使われることもあるでしょう。また段落記号はどうでしょう? 矢印は一般に横転なのですが、これら斜めや曲がっているものはどうあるべきなんでしょう。 Unicode 文字 文字名 Unicode character name UAX50 動作 InD 動作 和文 InD 動作 欧文 GC UAX11 Unicode Block UAX50 InD U+212B Å オングストローム ANGSTROM SIGN R U R Lu A Letterlike Symbols R UR U+00B6 ¶ 段落記号 PILCROW SIGN R U R Po A Latin-1 Supplement R UR U+203E ‾ オーバーライン 論理否定記号 OVERLINE R U R Po A General Punctuation R UR U+00A8 ¨ ウムラウト ダイエレシス DIAERESIS R U R Sk A Latin-1 Supplement R UR U+2194 ↔ 同等 LEFT RIGHT ARROW R U U Sm A Arrows R U U+21D2 ⇒ ならば(含意) RIGHTWARDS DOUBLE ARROW R U U Sm A Arrows R U U+21D4 ⇔ 同値 LEFT RIGHT DOUBLE ARROW R U U Sm A Arrows R U U+2934 ⤴ 曲がり矢印上がる ARROW POINTING RIGHTWARDS THEN CURVING UPWARDS R U R Sm N Supplemental Arrows-B R UR U+2935 ⤵ 曲がり矢印下がる ARROW POINTING RIGHTWARDS THEN CURVING DOWNWARDS R U R Sm N Supplemental Arrows-B R UR U+2196 ↖ 左上向矢印 NORTH WEST ARROW R U U So A Arrows R U U+2197 ↗ 右上向矢印 NORTH EAST ARROW R U U So A Arrows R U U+2198 ↘ 右下向矢印 SOUTH EAST ARROW R U U So A Arrows R U U+2199 ↙ 左下向矢印 SOUTH WEST ARROW R U U So A Arrows R U ––––––––––– 次は今までの反対。InDesign が横転を指示し、UAX#50 は正立を指示している文字たちです。ここは色々面白いです。ちょっと見 UAX#50 は、もはや理由のない JIS レガシーから脱却し、かつ言語関わらず同一のルールを作ることを目指している、かのように見えるのですが、そうでもないのかなと思える例も散見されます。提案者の一人である石井さんの解説がぜひ聞きたいです。 まず感嘆符・疑問符が二重になっているもの。もし和文欧文両方に使われるなら、和文書体なら正立で良いようにも思いますが何故か InDesign は横転を指示しています。単独の感嘆符・疑問符は InDesign でも正立ですし。また、想像ですが歴史的にこれらは縦中横から出てきているのではないでしょうか。プロポーショナルなら単に独立の疑問符や感嘆符を続ければ良いのですから。世界中の使用例を集めても、和文での使用が多いように想像しますがどんなもんなんでしょうね。この想像が正しいなら、その理由でも UAX#50 の言うように正立が望ましいことになります。 アステリズム ⁂ とダブルアステ ⁑ は、くだんの「句読点、記号・符号活用辞典(小学館)」によると、日本語ではほとんど使われない、とあります。もし使われるとしたら、それが欧文だとしても正立が望ましい?横転欧文の中に注釈記号を入れるものなのか、それがアステリズムやダブルアステの選択となるのか、どうでしょう? その次の分数は UAX#50 が不思議です。他に多数の分数があってそれらは横転なのに、この三つだけ正立を指示しています。 © ® は縦書きでどうあるべきなんでしょう? 縦書きのトレードマークや著作権表示って、例はどのくらいあるんでしょうね。 その次の数文字は数学記号です。最初の方で見たように数学記号に対しては InDesign が正立、UAX#50 が横転の例が多いのですが、これら数個は関係が反対になっています。何故これらだけ? 正立させるのは East Asian Width が N であるのとも微妙に齟齬があるように思います。 コマンド記号は隣に英字が来ますが、正立全角英字か横転プロポーショナル英字かどちらを前提とすれば良いでしょう? Unicode 文字 文字名 Unicode character name UAX50 動作 InD 動作 和文 InD 動作 欧文 GC UAX11 Unicode Block UAX50 InD U+203C ‼ 感嘆符二つ DOUBLE EXCLAMATION MARK U R R Po N General Punctuation U R U+2047 ⁇ 疑問符二つ DOUBLE QUESTION MARK U R R Po N General Punctuation U R U+2048 ⁈ 疑問符感嘆符 QUESTION EXCLAMATION MARK U R R Po N General Punctuation U R U+2049 ⁉ 感嘆符疑問符 EXCLAMATION QUESTION MARK U R R Po N General Punctuation U R U+2042 ⁂ アステリズム ASTERISM U R R Po N General Punctuation U R U+2051 ⁑ ダブルアステ TWO ASTERISKS ALIGNED VERTICALLY U R R Po N General Punctuation U R U+00BC ¼ 4分の1 VULGAR FRACTION ONE QUARTER U R R No A Latin-1 Supplement U R U+00BD ½ 2分の1 VULGAR FRACTION ONE HALF U R R No A Latin-1 Supplement U R U+00BE ¾ 4分の3 VULGAR FRACTION THREE QUARTERS U R R No A Latin-1 Supplement U R U+00A9 © 著作権表示記号 COPYRIGHT SIGN U R R So N Latin-1 Supplement U R U+00AE ® 登録商標記号 REGISTERED SIGN U R R So A Latin-1 Supplement U R U+210F ℏ エイチバー PLANCK CONSTANT OVER TWO PI U R R Ll N Letterlike Symbols U R U+2135 ℵ アレフ ALEF SYMBOL U R R Lo N Letterlike Symbols U R U+2127 ℧ モー INVERTED OHM SIGN U R R So N Letterlike Symbols U R U+2305 ⌅ 射影的関係 PROJECTIVE U R R So N Miscellaneous Technical U R U+2306 ⌆ 背景的関係 PERSPECTIVE U R R So N Miscellaneous Technical U R U+2318 ⌘ コマンド記号 PLACE OF INTEREST SIGN U R R So N Miscellaneous Technical U R ––––––––––– (下農さんへ業務連絡:こんな感じのまとまった分析などは、GitHub にアーカイブできるといいですね。Issue を作るのがいいでしょうか?)
Attachments
- text/html attachment: stored
- image/png attachment: PastedGraphic-2.png
Received on Monday, 19 July 2021 03:51:29 UTC