- From: Ethan Chen <chief@ethantw.net>
- Date: Sun, 24 Jun 2012 03:34:26 +0800
- To: Kang-Hao (Kenny) Lu <kennyluck@w3.org>
- Cc: Yuan Chao <yuanchao@gmail.com>, 梁海 <lianghai@gmail.com>, 中文HTML5同樂會ML <public-html-ig-zh@w3.org>
各位好! 我最近正在嘗試以JavaScript來實作這個功能,碰到幾個問題是文件中沒有提到的,希望大家可以討論一下。 例如,這個間距〔即便它比半形空白小(0.25em)〕,是否應該算作「一個空白」?使用者在複製文字時,是否會一同複製到這個空白?如果有,貼上時是否以「一個半形空白」存在? 如果使用者從網頁A複製了一段文字到網頁B,假設貼上時該間距以「一個半形空白」存在,那麼網頁B的效果可能就會和網頁A不同⋯⋯又如果以「text-spacing」取代原本在漢字、西文間的空白的時候呢?取代的間距該不該被複製成一個空白? Sincerely, Chen Yijun http://ethantw.net/ http://twitter.com/ethantw/ Kang-Hao (Kenny) Lu 於 2012/5/3 下午7:41 寫道: > (12/05/01 16:51), Yuan Chao wrote: >> 2012/4/27 Kang-Hao (Kenny) Lu <kennyluck@w3.org>: >> >> 把自己又加回了public-html-ig-zh,希望別再被踢出討論串了... XD > > 已經把問題的根源解決了,暫時應該不會再發生這種事、、、 > >>> 四之一、'cjk-puntuation'? >>> >>> 可能有人注意到我打字或是翻譯的習慣都是引號(一個 Unicode [P*])跟中文字 >>> 中間也有空格,這個目前規範有的 'alpha'([L*] 和 [M*])和 >>> 'numeric'([Nd]),所以是不是該加一個 'punctuation' 滿足這個需求?又這個 >>> 值應該是 'cjk-mode' 的預設嗎?(我猜日文需求的文件應該是說預設要有 >>> 'ideograph-puntuation',不過這個部份要考證一下) >>> >>> 相關的細節問題: >>> >>> * 這個要不要排除誇號「(」、「)」,比如說 Ubuntu 的翻譯指引是說要排除[3]。 >>> * 這該不該直接併到 'ideograph-alpha'? >>> >>> 測試了一下我發現 IE9 的 'alpha' 有包括單引號「'」但是沒有包括雙引號「"」 >>> 還有「'」(U+2018)這些,這合理嗎? >>> >>> [3] >>> http://wiki.ubuntu.org.cn/TranslatorsGuideline#.E5.85.B3.E4.BA.8E.E7.A9.BA.E6.A0.BC >>> >>> * 要不要包括 [S*] 類別,包括「+」「-」?要的話是不是把 'punctuation' 更 >>> 名成 'symbol' 更好? >> >> 之前在「嘗試」翻譯那份日文排版需求的文件,其實在其中就已經有相當詳細的規範。 > > 的確有,之前日文興趣小組也靠這份文件校正了「方塊字」的定義[1]。具體來說 > 的相關內容其實也不多(3.2.6): > > # d. Inter-character space, between hiragana (cl-15), katakana (cl-16) > # or ideographic characters (cl-19) and Western characters or > # European numerals, is a quarter em space (see Fig. 3.46). > > 還有 > > # (note 1) In this document, proportional Western characters and > # European numerals are treated as members of the Western characters > # (cl-27) class. > > 而 Western charcters 的列表裡包含了 U+0021-U+007E,也就是所有的 ASCII 字 > 符,所以包含上面提到的全部字符。 > > 這裡的差異主要是日文排版需求的文件只提供了*一個*指引,但是 'text- > spacing' 取值設計目前是用 'ideograph-alpha' 和 'ideograph-numeric' *兩 > 個*值組成的,所以會需要討論比較複雜的分類問題(像是「,」在 'alpha' 還是 > 'numeric' 好?或是要一個新值),我個人是覺得總的來說這種設計不好而應該用 > 'cjk-mode' 再用 'cjk-number-no-space'(亂取)扣掉不要的空白,那 > 'cjk-mode' 就可以直接用日文排版需求的要求。 > > [1] > http://lists.w3.org/Archives/Public/public-html-ig-jp/2011Jan/thread#msg139 > >> 雖然說中文跟日文的需求應該不會完全相同,但應該是相當值得參考的。 > > 這個提到一個問題就是 1/4em vs. 一個空白寬的問題,這個差異可能跟媒介(電 > 腦排版或是列印排版)有關但是我不清楚,不過總之那份日文需求本來是以列印排 > 版為主的。 > > 另一個比較顯而易見的問題就是剛剛上面裡的 "hiragana (cl-15), katakana > (cl-16) or ideographic characters" 根本不包含韓文和注音符號、、、 > > > 此致 > > Kenny >
Received on Saturday, 23 June 2012 19:35:03 UTC