W3C home > Mailing lists > Public > public-html-ig-zh@w3.org > June 2012

Re: 'text-spacing' 有關中英間隔部份的問題探討(原: 中英文字中的間隔)

From: Ethan Chen <chief@ethantw.net>
Date: Sun, 24 Jun 2012 03:34:26 +0800
Cc: Yuan Chao <yuanchao@gmail.com>, 梁海 <lianghai@gmail.com>, 中文HTML5同樂會ML <public-html-ig-zh@w3.org>
Message-Id: <B8D1AD38-608B-4957-AD00-495D84505948@ethantw.net>
To: Kang-Hao (Kenny) Lu <kennyluck@w3.org>
各位好!

我最近正在嘗試以JavaScript來實作這個功能,碰到幾個問題是文件中沒有提到的,希望大家可以討論一下。

例如,這個間距〔即便它比半形空白小(0.25em)〕,是否應該算作「一個空白」?使用者在複製文字時,是否會一同複製到這個空白?如果有,貼上時是否以「一個半形空白」存在?

如果使用者從網頁A複製了一段文字到網頁B,假設貼上時該間距以「一個半形空白」存在,那麼網頁B的效果可能就會和網頁A不同⋯⋯又如果以「text-spacing」取代原本在漢字、西文間的空白的時候呢?取代的間距該不該被複製成一個空白?



Sincerely,
Chen Yijun

http://ethantw.net/

http://twitter.com/ethantw/





Kang-Hao (Kenny) Lu 於 2012/5/3 下午7:41 寫道:

> (12/05/01 16:51), Yuan Chao wrote:
>> 2012/4/27 Kang-Hao (Kenny) Lu <kennyluck@w3.org>:
>> 
>> 把自己又加回了public-html-ig-zh,希望別再被踢出討論串了... XD
> 
> 已經把問題的根源解決了,暫時應該不會再發生這種事、、、
> 
>>> 四之一、'cjk-puntuation'?
>>> 
>>> 可能有人注意到我打字或是翻譯的習慣都是引號(一個 Unicode [P*])跟中文字
>>> 中間也有空格,這個目前規範有的 'alpha'([L*] 和 [M*])和
>>> 'numeric'([Nd]),所以是不是該加一個 'punctuation' 滿足這個需求?又這個
>>> 值應該是 'cjk-mode' 的預設嗎?(我猜日文需求的文件應該是說預設要有
>>> 'ideograph-puntuation',不過這個部份要考證一下)
>>> 
>>> 相關的細節問題:
>>> 
>>> * 這個要不要排除誇號「(」、「)」,比如說 Ubuntu 的翻譯指引是說要排除[3]。
>>> * 這該不該直接併到 'ideograph-alpha'?
>>> 
>>> 測試了一下我發現 IE9 的 'alpha' 有包括單引號「'」但是沒有包括雙引號「"」
>>> 還有「'」(U+2018)這些,這合理嗎?
>>> 
>>> [3]
>>> http://wiki.ubuntu.org.cn/TranslatorsGuideline#.E5.85.B3.E4.BA.8E.E7.A9.BA.E6.A0.BC

>>> 
>>> * 要不要包括 [S*] 類別,包括「+」「-」?要的話是不是把 'punctuation' 更
>>> 名成 'symbol' 更好?
>> 
>> 之前在「嘗試」翻譯那份日文排版需求的文件,其實在其中就已經有相當詳細的規範。
> 
> 的確有,之前日文興趣小組也靠這份文件校正了「方塊字」的定義[1]。具體來說
> 的相關內容其實也不多(3.2.6):
> 
>  # d. Inter-character space, between hiragana (cl-15), katakana (cl-16)
>  # or ideographic characters (cl-19) and Western characters or
>  # European numerals, is a quarter em space (see Fig. 3.46).
> 
> 還有
> 
>  # (note 1) In this document, proportional Western characters and
>  # European numerals are treated as members of the Western characters
>  # (cl-27) class.
> 
> 而 Western charcters 的列表裡包含了 U+0021-U+007E,也就是所有的 ASCII 字
> 符,所以包含上面提到的全部字符。
> 
> 這裡的差異主要是日文排版需求的文件只提供了*一個*指引,但是 'text-
> spacing' 取值設計目前是用 'ideograph-alpha' 和 'ideograph-numeric' *兩
> 個*值組成的,所以會需要討論比較複雜的分類問題(像是「,」在 'alpha' 還是
> 'numeric' 好?或是要一個新值),我個人是覺得總的來說這種設計不好而應該用
> 'cjk-mode' 再用 'cjk-number-no-space'(亂取)扣掉不要的空白,那
> 'cjk-mode' 就可以直接用日文排版需求的要求。
> 
> [1]
> http://lists.w3.org/Archives/Public/public-html-ig-jp/2011Jan/thread#msg139

> 
>> 雖然說中文跟日文的需求應該不會完全相同,但應該是相當值得參考的。
> 
> 這個提到一個問題就是 1/4em vs. 一個空白寬的問題,這個差異可能跟媒介(電
> 腦排版或是列印排版)有關但是我不清楚,不過總之那份日文需求本來是以列印排
> 版為主的。
> 
> 另一個比較顯而易見的問題就是剛剛上面裡的 "hiragana (cl-15), katakana
> (cl-16) or ideographic characters" 根本不包含韓文和注音符號、、、
> 
> 
> 此致
> 
> Kenny
> 

Received on Saturday, 23 June 2012 19:35:03 UTC

This archive was generated by hypermail 2.3.1 : Tuesday, 6 January 2015 20:43:50 UTC