Re: 全角の定義の再提案 from Kobayashi Toshi on 2023-10-31 (public-i18n-japanese@w3.org from October to December 2023)

From: Kobayashi Toshi <binn@k.email.ne.jp>
Date: Tue, 31 Oct 2023 13:46:29 +0900
To: "Atsushi Shimono (W3C Team)" <atsushi@w3.org>, public-i18n-japanese@w3.org
Message-Id: <AC5DA0BB536E455A6191A4D@k.email.ne.jp>

"Atsushi Shimono (W3C Team)"　様
木田　様
みなさま

　小林　敏　です．

自動で分かち書きに挿入するかどうかは別にして，実際のテキストデータに挿入されるものです．ラテン文字では語間に入る“ ”（U+0020）のことです．例えば，

　わかち書きに 挿入 するか どうかは 別にして U+3000を使用
 
の代わりに

 わかち書きに 挿入 するか どうかは 別にして　U+0020を1つ使用

　わかち書きに  挿入  するか  どうかは  別にして　U+0020を2つ使用
　
というようにテキストをデータ作成し，組版しようということで，“ ”（U+0020）の代わりになる，もうすこし幅の広い代わるものはないか，という話です．

私の見ている限りは，U+0020が1つでもいいみたい．


  "Atsushi Shimono (W3C Team)"　さんwrote

>　すみません、議論がCSSなどで自動で分かち書きの部分にspacingを入れたときの話なのか、元のデータ自体を分かち書きの状態にするための何かなのか、どちらなのかがこれまでの流れからはよく見えてないところなのですが、前者であればcss-text-4のhyphenate-characterみたいな形で空白文字を指定する追加オプションを入れるという手もあるのではないかと思います。
>https://www.w3.org/TR/css-text-4/#hyphenate-character

> サイト記述者が指定してもいいでしょうし、もしくは利用するユーザがブラウザのユーザスタイルシートで既定値を設定するために利用する、でもいいと思いますし。
>
> マークアップでの指定箇所かmecabなどで自動で分割場所を判別してなのかはCSS仕様書でもいろいろ議論されていたところかとは思いますが、CJKのテキストでの空白の完全除去オプションがない以上、元データで何らかの空白文字を挿入した分かち書きデジタルデータというのはそれなりなレアケースな気もしなくもないところです・・・

Received on Tuesday, 31 October 2023 04:46:50 UTC