- From: Atsushi Shimono (W3C Team) <atsushi@w3.org>
- Date: Thu, 9 Apr 2020 14:55:23 +0900
- To: public-i18n-japanese@w3.org
On 2020/04/09 09:56, 木田泰夫 wrote: > 👍 賛成です。一旦設計を単純にしておいて、もし、それではどうしても困るケース(e.g. 読みにくい、醜い、レイアウトが破綻する etc.)が見つかれば、その時に考える。 > >> soft line-breakを許可する・しない(言い換えるとoverflow?)オプション > > > 長い英単語をハイフンを入れて分割することがありますよね。あれは css 的にはどういう仕組みなんですか? 普通は改行しないけれど、困った時には改行位置が探せるようなもの。 CSS的にはハイフンを入れられるところは必要なら入れて業分割してね(はーと)という仕様を書 いているだけだとは思うのですが(まてこら)、英語で言うとTeXの実装のアルゴリズムベースがよく 使われている(元の論文も出ているはずなのでアルゴリズムとしてはそちらを見る方がいい?)はず、 です。UTR29とか、ICUでいうと https://unicode-org.github.io/icu-docs/apidoc/released/icu4c/classicu_1_1BreakIterator.html#details でしょうか? ただ、東南アジア系のタイ語とか(タイ・カダイ語族)の定まったハイフネーション規則がない言語 もあったりして、というよりはもしかしたら音節という概念でキレイにくくれないだけかもしれませ んが、そういう言語では辞書ベースにすべきかさてまた機械学習に頼るか、という議論があったりす るようです。 https://github.com/w3c/sealreq/issues/25
Received on Thursday, 9 April 2020 05:55:30 UTC