Re: 次回ミーティングは来週火曜日9月3日

下農さん、ありがとうございます。

> 2024/08/29 17:19、Atsushi Shimono (W3C Team) <atsushi@w3.org>のメール:
> 
>  shimonoです
> 
> On 2024/08/29 15:45, 木田泰夫 wrote:
>> JLReq TFのみなさま、
>> 台風が心配な今週ですが、皆様いかがお過ごしでしょうか?
>> 次のミーティングは来週火曜日9月3日の10時です。もう9月なんですね。
>> 議題は、溜まっているGitHub issueをレビューしましょう。また進展があればjlreq-dの第3章について。議題の提案を歓迎します。
> 
>  溜まってるもの、ではないですが、最近では日本語にも関連という意味で、こういうのとか、は。
> 
> https://github.com/w3c/csswg-drafts/issues/10565

>  Font fallback for (Unicode) decomposable characters is browser-dependent
>  往復変換のためのCJK互換文字の正規化の適用可否

これはおもしろい、かつJLReq TFとしても気になるかもしれませんね。

互換漢字がフォントになくて、しかしそれを正規化した漢字がフォントにある場合にそれを表示すべきか、CSS Fonts Module Level 4 <https://www.w3.org/TR/css-fonts-4/>に曖昧な部分があって、ブラウザごとに挙動が違うぞ、と。

例えば互換漢字であるU+FA1B「福」がテキストにあるとします。ブラウザは指定されたフォントリストにあるフォントを一つ一つ辿ってその文字があるかどうか調べます。注目しているフォントに「福」はないけれど、正規化した文字である「福」がある場合にそれを使うべきか、それとも「福」があるかフォントリスト全体を探すべきか、それが不明確で、ブラウザによって挙動が違うぞと。

スペックによると、複数文字によるシーケンスの場合は、正規化してみてそれもチェックすべきという答えになります。例えば「が」が「か+<合成濁点>」で表されている場合、注目しているフォントに「か+<合成濁点>」がなくても、合成済みの「が」があればそれを表示しなさいということになっています。逆に、同じ複数文字によるシーケンスでもバリエーションセレクタがついた文字の場合は、その特定の形を意図しているのだから、まずはバリエーションセレクタがついた状態で、それを処理できるフォントがあるかどうかリスト全体を探すことになります。(斜め読みしただけなので不正確な部分があるかもしれません。間違っていたら教えて)

しかし、一文字の場合にはどうするの?と。上に挙げた互換漢字のように、正規化前と後で別のコードポイントになる文字があります。その場合にどうすべきかが不明確とのこと。

日本語で使う互換文字は数が多いですし、X0213では別々の文字になってるのでこの規定は気になるところです。互換漢字が使われる場合の多くは意図的であろうことを考えると、バリエーションセレクタがついた文字と同様に、まずは正規化していない状態の文字を探すべきかと思いますが、どうでしょう。ミーティングで話してissueにコメントしましょう。


> https://github.com/w3c/csswg-drafts/issues/10751
>  [text-spacing-trim] Missing punctuations for Simplified Chinese (China)?
>  text-spacing-trimのU+FFxxへの適用??

これもおもしろいですね。どうも簡体中国語の全角感嘆符「!」や全角疑問符「?」は日本語の中点「・」のように全角の中に半角の文字が埋め込まれている状態であって、連続約物の処理に加えるべきだ、と。

これは日本語ではそのようなルールはないので、日本語には適用しないでね、とコメントすべきですね。


> https://github.com/w3c/csswg-drafts/issues/10714

>  Allow sideways-x and vertical-x to share a block formatting context?

よくわからなかったのですが、sideways-xとは例えば縦書きで日本語も横倒しするようなケースですかね?つまり、横書きをそのまま回転させたような状態。村上さんご存知?

> https://github.com/w3c/csswg-drafts/issues/10651

>  Suggestion: Support Unicode Character Sequences in unicode-range

これは、フォントと文字コード範囲を対応させる時に、現在はコードポイントの範囲しか指定できないのですが、複数Unicode文字からなるシーケンスも指定させて欲しいという要求。例えば絵文字と白黒テキスト(統合されている文字がある)を正確にコントロールしたいなど。

>  あと、epub関連向けのinfo shareでCSS snapshot 2024向けの作業も進んでる様子
> https://github.com/w3c/csswg-drafts/issues/10687

>  [css-2024] Add features to Safe to Release pre-CR Exceptions

これは村田さんがご存知かな?何かJLReq TFが気にするべき項目はありますか?

木田

Received on Saturday, 31 August 2024 00:48:40 UTC