Re: 和欧文間の空き or Segment Break Transformation Rules



> 2020/04/29 11:27、Atsushi Shimono (W3C Team) <atsushi@w3.org>のメール:
> 
>  shimonoです
> 
> # なんかわたしが勘違いしてる感も微妙にあるコメント@このメールではあるのですが、、
> 
> On 2020/04/28 23:31, Koji Ishii wrote:
>> おっしゃっていることはわかります。ポリシーの問題だとも思うので、一貫性が取れればどちらでもいいのかもしれません。
>> 恐らく基本の部分で、エラー率に対する考えに差がある気がします。Shift-JIS の頃は割ときれいに作れたんですが、Unicode になって、例えば Å は unify されてしまったので、これの前後で改行されたら処理できません。また、以前に小林先生のメールにもありましたが、一定数のユーザーは和欧間アキはいらない、あるいは空白文字の方がよい、と考えています。このため
>>    春はあけぼ
>>    のが nice
>>    ですって。
>>       ↓ ↓ ↓
>>    春はあけぼのが niceですって。
> 
>  2000年代一桁のウェブ上の文章、特に技術ドキュメントサイトでは「半角空白」を和欧間空きとして入れる、
> というのを規則にしていたところも多かったと思います。
> # いま思い起こせば、確かMDN(の前身のMDCの前身のdevmo)の記述・編集規則を作ったときにそういう規則を明
> 記したような覚えがあります。

私もそのように入力することが多いです。が、それは JLReq の要求していることと違うでしょう?

>  という中で、改行をするなら和欧間のところか、もしくは約物の後で入れるべし、というガイドラインを設
> 定していたところは確かにありました。
> 
> 
>> これはこれでそういうユーザーにとっては迷惑なわけです。なので、どうやってルールを作っても、エラー率は一定以下にはならない、という前提が私にはあります。
>> で、
>> 1. 親切度は低いが、エラー率がゼロあるいは低いシステム
>> 2. 新設度は高いが、エラー率がそこそこあるシステム
>> だと、エラーの記憶が強いネガティブイメージになりやすいため、1の方がよい、というのが私のロジックです。
> 
>  +1
> 
>> 和欧間アキが昔ほど頻繁には使われない、という点も私と木田さんでは認識が違うんじゃないでしょうか。和欧間アキは、和文フォントの中の欧文の質があまりよくなく、欧文には欧文フォントを組み合わせる、という時代にはより頻繁に使われ、Word でもデフォルトオンにしましたが、和文フォントの中の欧文文字の品質がよくなるにつれ、必要となる頻度は減ってきていると認識しています。和欧間アキを使いたくない人が相応数存在する、という前提が、木田さんと私では違うのかな、と感じています。
> 
>  というところで、宗派としては大きく分けて
> ・和欧間空きを入れない宗派、改行がsegment break経由でU+0020に置換されるのも困っている (ideograph-*は設定しないが、white-spaceにも不満が残る)
> ・和欧間空きを入れる宗派、あまりspacing量は気にしないのでU+0020でも大丈夫 (ここが意外と多そうではある?)
> ・和欧間空きを入れる宗派、spacing量は気にしたいのでideograph-*を設定してsegment break経由のU+0020とかも置換してほしい宗派
> になるのかな、という気がしています。
> 
> CSS-text-3 white space phases: https://drafts.csswg.org/css-text-3/#white-space-rules
> あんちょこ: https://himorin.github.io/w3c-memo/i18n/notes/white_space.html#%E7%A9%BA%E7%99%BD%E6%96%87%E5%AD%97%E5%87%A6%E7%90%86-section-41

> 
>  という中で、エラー率、という意味では
> ・既存のドキュメントで改行から変換されたものを含むU+0020が和欧間・約物前後に入っているものは大量にある
> ・幅が狭いZsの文字を入れまくる処理はめんどくさくてやりたくないが全部U+0020 (1/2em)より細いspacingにしたい宗派
> の組み合わせが一番不満を抱くのかな、と思うのです。また、もちろん、空きを入れない宗派もある程度困ると
> 表明するでしょうけれど。。というところで、追加としてもあまり複雑にならない程度で行くことを想定するな
> らば、white-spaceにアグレッシブに空白除去するモードがあってもいいのかな、と思ったりするのです。
>  多分、前述の2つ目の宗派はいまのwhite space除去規則の中でのU+0020を除去する処理(約物かP*/S*、F/H/Wide
> の2つが両側に連なるsegment breakは除去)でだいたい満足しているのかな、と思うところですので。。
> # この両側の制限が本当にいいのかはもちとじっくり考えてみたいところですが、、。
> 
>  いかがでしょうか、、

ということで(敏先生や石井さんへのメールを受けて)、この問題を Segment Break Transformation の問題に矮小化して考えたくないところ。まず足腰をちゃんとしたら、Segment Break Transformation Rules をどうすべきかの回答が出てくるでしょう。

木田

> 

Received on Wednesday, 29 April 2020 03:06:07 UTC