W3C home > Mailing lists > Public > public-html-ig-zh@w3.org > May 2012

Re: 'text-spacing' 有關中英間隔部份的問題探討(原: 中英文字中的間隔)

From: Yuan Chao <yuanchao@gmail.com>
Date: Tue, 1 May 2012 16:51:06 +0800
Message-ID: <CAADKi7mB_s039hW04CFELyj9w2SeD61LGM4hFS-jcfKqsW0j9w@mail.gmail.com>
To: "Kang-Hao (Kenny) Lu" <kennyluck@w3.org>
Cc: 梁海 <lianghai@gmail.com>, Ethan Chen <chief@ethantw.net>, 中文HTML5同樂會ML <public-html-ig-zh@w3.org>
2012/4/27 Kang-Hao (Kenny) Lu <kennyluck@w3.org>:

把自己又加回了public-html-ig-zh,希望別再被踢出討論串了... XD

> 原來的討論串:http://lists.w3.org/Archives/Public/public-html-ig-zh
> /2010Oct/subject#msg20

> == CSS4 ==
>
> @、最根本的問題 -- 為什麼至今沒有人用 'text-autospace'?
個人相當認同梁海兄的說法!

> 這個需求對使用者應該是存在的(有「為什麼你們就是不能加個空格呢?」這種瀏
> 覽器套件[2]),所以沒有人用的原因是什麼呢?

> 四、'cjk-mode'?
>
> 我覺得 'ideograph-alpha' 跟 'ideograph-numeric' 同時使用的可能性比單獨使
> 用@個高(這個假設對嗎?),所以有@個同時啟動兩個的值應該比較好用@點。
>
> 四之@、'cjk-puntuation'?
>
> 可能有人注意到我打字或是翻譯的習慣都是引號(@個 Unicode [P*])跟中文字
> 中間也有空格,這個目前規範有的 'alpha'([L*] 和 [M*])和
> 'numeric'([Nd]),所以是不是該加@個 'punctuation' 滿足這個需求?又這個
> 值應該是 'cjk-mode' 的預設嗎?(我猜日文需求的文件應該是說預設要有
> 'ideograph-puntuation',不過這個部份要考證@下)
>
> 相關的細節問題:
>
> * 這個要不要排除誇號「(」、「)」,比如說 Ubuntu 的翻譯指引是說要排除[3]。
> * 這該不該直接併到 'ideograph-alpha'?
>
> 測試了@下我發現 IE9 的 'alpha' 有包括單引號「'」但是沒有包括雙引號「"」
> 還有「'」(U+2018)這些,這合理嗎?
>
> [3]
> http://wiki.ubuntu.org.cn/TranslatorsGuideline#.E5.85.B3.E4.BA.8E.E7.A9.BA.E6.A0.BC
>
> * 要不要包括 [S*] 類別,包括「+」「-」?要的話是不是把 'punctuation' 更
> 名成 'symbol' 更好?
之前在「嘗試」翻譯那份日文排版需求的文件,其實在其中就已經有相當詳細的規範。
雖然說中文跟日文的需求應該不會完全相同,但應該是相當值得參考的。

Requirements for Japanese Text layout.
http://www.w3.org/TR/2009/NOTE-jlreq-20090604/

(自己已經有很長@段時間沒碰了,翻譯進度應該還是1x%)

> 八、字符類別
>
> 這個部份非常、、雜亂,目前 'ideograph' 和 'alpha' 的定義分別是
>
>  # 方塊文字
>  #
>  # 包含下面所有字符:
>  #   * 所有在範圍 U+3041 到 U+30FF 裡除了 Unicode 標點 [P*] 以外的字
>  #     符。
>  #   * CJK 筆劃(U+31C0 到 U+31EF)。
>  #   * 片假名語音擴展(U+31F0 至 U+31FF)。
>  #   * 所有屬於 Unicode 漢文字(Han)屬性的字符 [UAX24]。
>
> 和
>
>  # 非方塊字母
>  #
>  # Unicode 字母類別 [L*] 與標記類別 [M*] 裡,不滿足任何以下條件的字符:
>  #   * 是@個方塊文字。
>  #   * 被 [UAX11] 歸為東亞全形(F)。
>  #   * 在豎排中透過 'text-orientation' 屬性或 'text-combine' 屬性為
>  #     直立。
>
> 首先,韓文(Hangul)不在方塊文字裡,這不合 IE9 的實@,不過這個到底好不
> 好可能要去韓文興趣小組問@下。不過這個對中文為主的網頁的影響是:韓文不是
> 東亞全形(而是東亞寬字符(W)),所以韓文被歸在 'alpha' 裡,也就是在
> 'ideograph-alpha' 中混有韓文的中文網頁會有這些空格,這是合理的嗎?
>
> 我感覺這裡的非方塊字母的條件之@的「被 [UAX11] 歸為東亞全形(F)」應該改
> 成「被 [UAX11] 歸為東亞全形(F)或東亞寬字符(W)」,這裡該做的是是把所
> 有是東亞寬字符(W)但是不是方塊文字的字符都拿出來想@下、測@下。
>
> 再來,方塊文字目前不包括注意符號(因為注意符號屬於注意符號文字
> (Bopomofo),不是漢文字),這其實符合 IE9 的實@(中文和注音符號中間在
> 'ideograph-alpha' 的時候有空隔),不過這合理嗎?
>
> 我感覺 IE9 的實@比較接近把方塊文字解讀成「被 [UAX11] 歸為東亞全形(F)
> 或東亞寬字符(W)的 Unicode 標點 [P*] 以外的字符,但是拿掉注音符號。」,
> 這個定義好像不符合日文需求文件的要求[4],但是這也要考證@下。
>
> (歡迎用 CSSOM 的 API 把 IE9 整個跑@遍了解 IE9 到底怎麼分類字符的!)
>
> 另外,'numeric' 的定義是:
>
>  # 非方塊數字
>  #
>  # Unicode 數字-十進位數字類別 [Nd],不滿足任何以下條件的字符:
>  #   * 被 [UAX11] 歸為東亞全形(F)。
>  #   * 在豎排中透過 'text-orientation' 屬性或 'text-combine' 屬性為
>  #     直立。
>
> 但是我看 IE9 根本沒支援 0-9 以外的數字,老實說有沒有支援那些應該已經到沒
> 有人會在意的程度了,還是簡化成 0-9 就好了吧、、、
>
> [4]
> http://lists.w3.org/Archives/Public/public-html-ig-jp/2011Jan/thread#msg139


-- 
Best regards,
Yuan Chao
Received on Tuesday, 1 May 2012 08:51:57 UTC

This archive was generated by hypermail 2.3.1 : Tuesday, 6 January 2015 20:43:50 UTC