- From: Kobayashi Toshi <binn@k.email.ne.jp>
- Date: Tue, 31 Oct 2023 13:46:29 +0900
- To: "Atsushi Shimono (W3C Team)" <atsushi@w3.org>, public-i18n-japanese@w3.org
"Atsushi Shimono (W3C Team)" 様 木田 様 みなさま 小林 敏 です. 自動で分かち書きに挿入するかどうかは別にして,実際のテキストデータに挿入されるものです.ラテン文字では語間に入る“ ”(U+0020)のことです.例えば, わかち書きに 挿入 するか どうかは 別にして U+3000を使用 の代わりに わかち書きに 挿入 するか どうかは 別にして U+0020を1つ使用 わかち書きに 挿入 するか どうかは 別にして U+0020を2つ使用 というようにテキストをデータ作成し,組版しようということで,“ ”(U+0020)の代わりになる,もうすこし幅の広い代わるものはないか,という話です. 私の見ている限りは,U+0020が1つでもいいみたい. "Atsushi Shimono (W3C Team)" さんwrote > すみません、議論がCSSなどで自動で分かち書きの部分にspacingを入れたときの話なのか、元のデータ自体を分かち書きの状態にするための何かなのか、どちらなのかがこれまでの流れからはよく見えてないところなのですが、前者であればcss-text-4のhyphenate-characterみたいな形で空白文字を指定する追加オプションを入れるという手もあるのではないかと思います。 >https://www.w3.org/TR/css-text-4/#hyphenate-character > サイト記述者が指定してもいいでしょうし、もしくは利用するユーザがブラウザのユーザスタイルシートで既定値を設定するために利用する、でもいいと思いますし。 > > マークアップでの指定箇所かmecabなどで自動で分割場所を判別してなのかはCSS仕様書でもいろいろ議論されていたところかとは思いますが、CJKのテキストでの空白の完全除去オプションがない以上、元データで何らかの空白文字を挿入した分かち書きデジタルデータというのはそれなりなレアケースな気もしなくもないところです・・・
Received on Tuesday, 31 October 2023 04:46:50 UTC