- From: Kang-Hao (Kenny) Lu <kennyluck@w3.org>
- Date: Thu, 03 May 2012 19:41:01 +0800
- To: Yuan Chao <yuanchao@gmail.com>
- CC: 梁海 <lianghai@gmail.com>, Ethan Chen <chief@ethantw.net>, 中文HTML5同樂會ML <public-html-ig-zh@w3.org>
(12/05/01 16:51), Yuan Chao wrote: > 2012/4/27 Kang-Hao (Kenny) Lu <kennyluck@w3.org>: > > 把自己又加回了public-html-ig-zh,希望別再被踢出討論串了... XD 已經把問題的根源解決了,暫時應該不會再發生這種事、、、 >> 四之一、'cjk-puntuation'? >> >> 可能有人注意到我打字或是翻譯的習慣都是引號(一個 Unicode [P*])跟中文字 >> 中間也有空格,這個目前規範有的 'alpha'([L*] 和 [M*])和 >> 'numeric'([Nd]),所以是不是該加一個 'punctuation' 滿足這個需求?又這個 >> 值應該是 'cjk-mode' 的預設嗎?(我猜日文需求的文件應該是說預設要有 >> 'ideograph-puntuation',不過這個部份要考證一下) >> >> 相關的細節問題: >> >> * 這個要不要排除誇號「(」、「)」,比如說 Ubuntu 的翻譯指引是說要排除[3]。 >> * 這該不該直接併到 'ideograph-alpha'? >> >> 測試了一下我發現 IE9 的 'alpha' 有包括單引號「'」但是沒有包括雙引號「"」 >> 還有「'」(U+2018)這些,這合理嗎? >> >> [3] >> http://wiki.ubuntu.org.cn/TranslatorsGuideline#.E5.85.B3.E4.BA.8E.E7.A9.BA.E6.A0.BC >> >> * 要不要包括 [S*] 類別,包括「+」「-」?要的話是不是把 'punctuation' 更 >> 名成 'symbol' 更好? > > 之前在「嘗試」翻譯那份日文排版需求的文件,其實在其中就已經有相當詳細的規範。 的確有,之前日文興趣小組也靠這份文件校正了「方塊字」的定義[1]。具體來說 的相關內容其實也不多(3.2.6): # d. Inter-character space, between hiragana (cl-15), katakana (cl-16) # or ideographic characters (cl-19) and Western characters or # European numerals, is a quarter em space (see Fig. 3.46). 還有 # (note 1) In this document, proportional Western characters and # European numerals are treated as members of the Western characters # (cl-27) class. 而 Western charcters 的列表裡包含了 U+0021-U+007E,也就是所有的 ASCII 字 符,所以包含上面提到的全部字符。 這裡的差異主要是日文排版需求的文件只提供了*一個*指引,但是 'text- spacing' 取值設計目前是用 'ideograph-alpha' 和 'ideograph-numeric' *兩 個*值組成的,所以會需要討論比較複雜的分類問題(像是「,」在 'alpha' 還是 'numeric' 好?或是要一個新值),我個人是覺得總的來說這種設計不好而應該用 'cjk-mode' 再用 'cjk-number-no-space'(亂取)扣掉不要的空白,那 'cjk-mode' 就可以直接用日文排版需求的要求。 [1] http://lists.w3.org/Archives/Public/public-html-ig-jp/2011Jan/thread#msg139 > 雖然說中文跟日文的需求應該不會完全相同,但應該是相當值得參考的。 這個提到一個問題就是 1/4em vs. 一個空白寬的問題,這個差異可能跟媒介(電 腦排版或是列印排版)有關但是我不清楚,不過總之那份日文需求本來是以列印排 版為主的。 另一個比較顯而易見的問題就是剛剛上面裡的 "hiragana (cl-15), katakana (cl-16) or ideographic characters" 根本不包含韓文和注音符號、、、 此致 Kenny
Received on Thursday, 3 May 2012 11:41:48 UTC