Re: Meeting notes 2020·12·01


主に小林さんに:
Unicode に和文組版に必要で現在欠けている文字を追加する場合、その文字を発信し受信できる環境を整えるためには、文字セットとして何らかの権威づけが必要ですよね。コードポイントを決めると言う意味での国内文字コード規格はもうその役目を終わったと思うのですが、文字セットという意味では依然として重要に思います。その手の筋道って可能性があるんでしょうか? まあ、デファクトでもいいのかもしれませんが。


メモ
これはミーティングの中に出てきたような気がするので、忘れないうちに。役物の使われ方をちゃんと調べなきゃという話がミーティング中どこかに出てきたように思います。どなたがどの文脈で言われたのか残念ながら覚えていないのですが。それ、真剣に考えるべき重要な仕事のように思えてきました。JLReq TF でも他でもいいのですが、和文に出てくるそれぞれの役物について、その使い方や期待されるグリフのデザインについてちゃんとドキュメントするという作業がどこかで必要に思います。漢字の典拠調査に対応する作業であって、X 0213 でやってほしかったな。しかし手弁当でできる範囲の仕事ではない可能性もありますね。

木田

> 2020/12/01 16:32、木田泰夫 <kida@mac.com>のメール:
> 
> 私の追加コメント:
> 
> ・文字の追加がらみで:漫画などで膨大な使用実績のある、母音に濁音、を日本語文字セットに加えるべきではと思っています。コードポイントは既にありますから(合成の濁音をつけるだけ)、後は誰かが日本語の文字セットとしてこれもあるよ、ということを何らかの形で権威づけて示すだけでしょうかね。
> 
> ・文字を加えるのは良いとして、利用者がそれを使って便利になって幸せになる筋道が必要ですね。反対にそれなしに文字を加えても肥やしを増やすだけでしょう。入力はどうするか、エンジンはどう振る舞うか、その文字を含んだフォントと含まないフォントの混在環境、など複雑な問題になりそうです。
> 
> 木田
> 
>> 2020/12/01 16:28、木田泰夫 <kida@mac.com>のメール:
>> 
>> 中国ですなるという日付の間の中黒を、私もしてみむとするなり by 紀貫之。ということで、日付の区切りに中黒 U+00B7 を使ってみました。なかなかいい感じですね。
>> 
>> さて今日 2020·12·01のミーティングメモです。
>> 
>> 1. 今日の一番大きなポイントはおそらく、JLReq の示しているコードポイント、ひいては JIS X 0213 & Unicode の合意によるアサインメントにはてなマークをつけた、つまりお国に反旗を翻したことでしょう。ハイフン類、三点リーダ、クオーテーションなどにおいて、お互いに似た和文、欧文の約物が統合されているのだけれど、グリフの設計が異なるだけではなくて、振る舞いが異なるということです。「プロポーショナルな文字に欧文空白を組み合わせて全角っぽくするのは間違ってる!」という小林さんの叫びも聞こえてきました。
>> 
>> はてなマークを付けたのは下の文字たちです:
>> cl-02/cl-27
>> 34
>> A
>> R
>> closingBracket_other
>> 
>> westernChar
>> 右シングル引用符,右シングルクォーテーションマーク
>> 
>> ’
>> U+2019?
>> RIGHT SINGLE QUOTATION MARK
>> cl-02/cl-27
>> 35
>> A
>> R
>> closingBracket_other
>> 
>> 
>> 右ダブル引用符,右ダブルクォーテーションマーク
>> 
>> ”
>> U+201D?
>> RIGHT DOUBLE QUOTATION MARK
>> cl-03/cl-27
>> 40
>> A
>> R
>> hyphen_middlePunctuation
>> 
>> 
>> ハイフン(四分)/ハイフン
>> 
>> ‐
>> U+2010?
>> HYPHEN
>> cl-03/cl-27
>> 41
>> A
>> R
>> hyphen_middlePunctuation
>> 
>> 
>> 二分ダーシ,ダッシュ(二分)
>> 1-03-92
>> –
>> U+2013?
>> EN DASH
>> cl-08/cl-27
>> 68
>> A
>> R
>> inseparable_emDash
>> ideographic
>> 
>> ダッシュ(全角)/ダッシュ
>> 1-01-29
>> —
>> U+2014?
>> EM DASH
>> cl-08/cl-27
>> 69
>> A
>> R
>> inseparable_twoDotLeader
>> ideographic
>> 
>> 二点リーダ
>> 
>> ‥
>> U+2025?
>> TWO DOT LEADER
>> cl-08/cl-27
>> 70
>> A
>> R
>> inseparable_ellipsis
>> ideographic
>> 
>> 三点リーダ
>> 
>> …
>> U+2026?
>> HORIZONTAL ELLIPSIS
>> また、全角二倍、全角三倍ダーシも、JLReq の表にはありませんがこの範疇です。
>> 
>> (横道ですが、「はてな」マークって、はんなり、京都っぽい名前ですね)
>> 
>> 2. 同様なカテゴリの問題として、波線を長音として使う用法は振る舞いが長音と同じになるべきであって、つまり cl-03 ハイフン類としての波線とは別ではないかという問題提起がありました。
>> 
>> 3. いくつかの約物を欧文専用として和文用のクラスから抜くことになり、
>> cl-01/cl-27
>> 15
>> N
>> R
>> openingBracket_other
>> 
>> 
>> 始め二重山括弧引用記号,始めギュメ
>> 1-09-08
>> «
>> U+00AB
>> LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
>> 
>> cl-02/cl-27
>> 33
>> N
>> R
>> closingBracket_other
>> 
>> 
>> 終わり二重山括弧引用記号,終わりギュメ
>> 1-09-18
>> »
>> U+00BB
>> RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
>> 
>> 
>> 4. また cl-12 前置省略記号、cl-13後置省略記号、のクラスを削除し、全角のものは漢字と同じ扱い、欧文幅のものは cl-27 (日本語以外の放り込み場所)に分配することになりました。この区別は UAX 50 の Vertical Orientation が R のものは欧文、U/Tu は和文ということで明確です。
>> 
>> 5. 今日は Eric の提案についての議論は行わなかったのですが、縦組みだから和文ルール、横組みだから欧文ルールというわけには行かない、という話が敏先生から何度か聞こえました。
>> 
>> 6. その他の細かい点
>>    ・U+4EDD 仝、の挙動は?→漢字と同じ
>> 
>> 
>> 次回二週間後の 12/15 は cl-15 ひらがなからです。
>> 
>> 抜けや間違いがあったら教えてください。後で英文の meeting minutes を書きます。
>> 
>> 木田
>> 
>> 
>> 
>> 
> 

Received on Tuesday, 1 December 2020 11:51:18 UTC