W3C home > Mailing lists > Public > public-html-ig-zh@w3.org > September 2010

Re: <ruby> 應用上的幾個問題

From: Yuan Chao <yuanchao@gmail.com>
Date: Tue, 28 Sep 2010 23:07:03 +0200
Message-ID: <AANLkTi=PxTQP74d7nAUUJ+jHesaeLEpRZhaPDYOGRTM8@mail.gmail.com>
To: Ethan Chen <chief@ethantw.net>
Cc: oldcat <blog.oc@gmail.com>, 中文HTML5同樂會ML <public-html-ig-zh@w3.org>
2010/9/28 Ethan Chen <chief@ethantw.net>

> 像這樣用css的方式排注音,不知道排一篇一千字的文章需要花多少時間?
>
> 正確來說是用 HTML。CSS 只是「現行」輔助不支援該標籤的瀏覽器顯示的工具而已。
>
個人覺得整篇都是要標注音的話,還是用注音字型比較快。 XD
日文浮假名一句話裡面,只會有標幾個字而已,所以根本沒有考慮到大量標注的問題吧?

不過話說回來,這年頭應該沒有多少人是真的用文字編輯器「刻」html的。多半還是用html的WYSIWYG軟體吧?
所以只要編輯器處理掉,剩下的只有多餘數據的問題。有開server端gzip壓縮的話,也就不是問題了。


> 我認為可以用程式把一千字的注音寫出來,把聲調之類的東西用正確的標籤排好,程式再找出各個「破音字」讓作者手動填入(或選擇)正確的讀音。所以還是應該用
> HTML 寫出各個字的讀音,重點是,看你「怎麼寫」。HTML 跟 Office
> 辦公軟體不一樣,是負責排版和呈現的語言,不是負責找出各個漢字讀音的軟體。你給它什麼,它就呈現什麼。
>
就是這樣子啊。




寫出這樣一個程式應該不難,只是寫出來的東西需要花比較多時間才能人工「讀懂」它的意思。
>
> 或者是,以 XML(JSON?!) 寫出各個漢字的讀音,遇到破音字再手動填音,最後以 Javascript 顯示結果(手填的部份跳過)。或推動 W3C
> 放入 HTML 5 標準裡?這也能適用日文漢字假名標音。如果放入標準,這個 XML
> 要由誰來制定?像台灣一天到晚改讀音、很多漢字讀音又與中國大陸不同(如:垃圾、莘莘學子等等),這個表應該要能夠常常更新,那誰來做呢?
>
> 又,這不是一個蠢問題呀!可以幫助我們思考解決方案。
>
> P.S. 還有我認為,<rb> 跟 <rt> 應該要分開寫,而不是把 <rt> 直些寫在字的後面,這樣在 copy and paste 的時候,是比較
> user-friendly 的。但這又加深了 code 閱讀的困難度。大家的想法是?
>
>
>
> 在 Sep 29, 2010 12:07 AM 時, oldcat 寫到:
>
> 不好意思,我想冒昧問一下:
>
> 像這樣用css的方式排注音,不知道排一篇一千字的文章需要花多少時間?
>
> 如果這是個蠢問題,請大家原諒。
>
> oc
>
>
>
> 2010/9/28 Ethan Chen <chief@ethantw.net>
>
>> https://addons.mozilla.org/en-US/firefox/addon/6812/
>> 這是我在 Firefox 上測試的結果:
>> [image: Content]
>> 呃,我有把稍早提到的 CSS 和 <b class="proper-noun"> 都去掉。不知道這是什麼原因.......
>>
>>
>> 關於聲調號的部份,那份文件沒有提到該怎麼實作,但光按現行的 CSS 偽類應該做不出來。不過 W3C 提到「 ruby on
>> ruby」,所以可不可以是...
>>
>> <ruby>
>>
>> <rb>白</rb>
>>
>> <rb>雪</rb>
>>
>> <rb>姑</rb>
>>
>> <rb>娘</rb>
>>
>> <rb>兒</rb>
>>
>>
>> <rt>ㄅㄞ<rt>ˊ</rt></rt>
>>
>>  <rt>ㄒㄩㄝ<rt>ˇ</rt></rt>
>>
>> <rt>ㄍㄨ</rt>
>>
>>  <rt rbspan="2"><rt>˙</rt>ㄋㄧㄤㄦ</rt>
>>
>> </ruby>
>>
>> 就是 <rt> 裡再用一個 <rt> 來包裹聲調。
>>
>> 大家應該都同意在 :lang(zh-tw)
>> 的情況下,注音符號應該預設放在字的右邊並寫成直式。但如果想把注音符號放在字上面寫成橫式呢(排版的需求之類的)?下面這個方法不曉得對不對:
>>
>> ruby rt {  writing-mode: lr-tb; }
>>
>>
>>
>>
>> 在 Sep 28, 2010 9:46 PM 時, Yuan Chao 寫到:
>>
>> 2010/9/28 Ethan Chen <chief@ethantw.net>:
>>
>> 回到上面的圖片,關於文字間距的部份當然是 Safari 的結果比較正確,以 <rt> 的寬度來決定字寬。
>>
>>
>> 看起來 Firefox 的文字間隔是有問題的,兩個字的ruby基本上都黏在一起。畢竟注音不像假名,並不是一個符號一個音。
>>
>>
>> 這個問題可以用 margin: 0 Xem; 來解決,所以我覺得倒是還好。而且 Firefox 上的結果是我自己拿 CSS
>>
>> 實作的,可能問題比較多。還請指教。
>>
>> 剛好看了OOO提到的舊XHTML規格中的ruby支援,中文注音的聲調符應該在最後韻母的右上角,
>> 而不是同樣大小的方塊字。
>>
>> 從舊的XHTML ruby addon的連結,有個新的addon是支援HTML5 ruby的。
>> https://addons.mozilla.org/en-US/firefox/addon/6812/
>> 可以麻煩比較一下嗎?
>>
>> 另外,一直有個問題:「ㄧ」這個注音,橫書的時候到底應該打成直的還是橫的?就方塊字來說,字間距都是一樣沒有省到。
>>
>>
>> 請看教育部關於注音符號〈總表〉的內容 [1]。「ㄧ」在橫寫時的確是直(豎)的筆劃,看來這只是規定,並不是為了省間距喔。
>>
>> 又,這其實不是「打」的問題,unicode 沒有為這個符號收錄直寫、橫寫兩個字符,怎麼顯示其實是看字體(圖片上的字體是我拿「教育部標準楷書
>>
>> [2]」取出注音符號的部份後,修改「ㄧ」字為直豎而成,再用 @font-family
>>
>> 鑲入網頁)。所以目前技術上的解法,只能拿兩個字體分別顯示橫寫與直寫。又為了字體風格一致,可能得編好之後用 @font-family
>>
>> 鑲入。目前教育部標準楷書是「創用 CC 姓名標示-禁止改作 3.0
>>
>> 台灣」授權,只能寫信去要求教育部修改並為我們提出注音符號,或請教育部給別的授權。Google 跟文泉驛的 Droid Sans Fallback
>>
>> 也是不錯的選擇,提出注音符號之後,也頂多 20, 30kb*2。
>>
>> 了解。
>> 只是unicode沒有收,新建字是沒有流通性的。
>>
>> 難怪教育部辭典網頁下面,提供注音輸入的地方,用的是橫的ㄧ。
>> 而辭典內標示的注音,用的是全形"column"符號。(很醜)
>>
>>
>> 又想到雙音節的漢字,類似「廿、浬」這樣的字出現在一篇標註注音的文章裡頭時,該怎麼標音?現在會全文注音的也只有國小課本,但印象中小學還沒教到這種程度的字咧。
>>
>>
>> 根據教育部國語辭典:
>>
>> 廿   注音一式 ㄋ|ㄢˋ
>>
>>
>> 浬   注音一式 ㄌ|ˇ
>>
>>
>> 可是如果是在得念「二十」和「海里」的時候呢?
>>
>>
>> 「大家好,我今年廿三歲。」
>>
>>
>> 這...不會有人說「ㄋㄧㄢˋ(niàn)ㄙㄢ(sān)」吧,lol。
>>
>>
>> 所以說小弟寫這段啊! :)
>>
>> 就以前看過日文的做法是,就把所有的音節都塞進去,前後字距依ruby調整。但馬上又會遇到上述ruby斷字的問題。
>>
>>
>> http://www.edu.tw/files/site_content/M0001/juyin/tt1.htm?open
>>
>> http://www.edu.tw/mandr/content.aspx?site_content_sn=3591
>>
>> 看到 "創用CC「姓名標示-禁止改作3.0臺灣版」授權" 真是欣慰,
>> 比之前那個不准散佈還要簽授權書好多了。
>> 但是缺點就是改了就不能散佈了。
>>
>>
>>
>>
>> 在 Sep 28, 2010 8:21 PM 時, Yuan Chao 寫到:
>>
>>
>> 2010/9/28 Ethan Chen <chief@ethantw.net>
>>
>>
>> 大家好,我也來發篇討論吧。這是我在實際應用上遇到的問題。
>>
>> 下面分別是 Webkit (Safari,上圖) 原生支援的 <ruby> 與 Firefox(下圖)以 CSS 實作的 <ruby> 。
>>
>>
>> 不好意思,我這邊看不到「上圖」。
>>
>> 另外,一直有個問題:「ㄧ」這個注音,橫書的時候到底應該打成直的還是橫的?就方塊字來說,字間距都是一樣沒有省到。
>>
>>
>> 回到上面的圖片,關於文字間距的部份當然是 Safari 的結果比較正確,以 <rt> 的寬度來決定字寬。
>>
>>
>> 看起來 Firefox 的文字間隔是有問題的,兩個字的ruby基本上都黏在一起。畢竟注音不像假名,並不是一個符號一個音。
>>
>>
>>
>> p.s.
>>
>>
>> 又想到雙音節的漢字,類似「廿、浬」這樣的字出現在一篇標註注音的文章裡頭時,該怎麼標音?現在會全文注音的也只有國小課本,但印象中小學還沒教到這種程度的字咧。
>>
>>
>> 根據教育部國語辭典:
>>
>> 廿   注音一式 ㄋ|ㄢˋ
>>
>> 浬   注音一式 ㄌ|ˇ
>>
>>
>> 就以前看過日文的做法是,就把所有的音節都塞進去,前後字距依ruby調整。但馬上又會遇到上述ruby斷字的問題。
>>
>>
>>
>> --
>>
>> Best regards,
>>
>> Yuan Chao
>>
>>
>>
>>
>>
>>
>> --
>> Best regards,
>> Yuan Chao
>>
>>
>>
>
>


-- 
Best regards,
Yuan Chao
Received on Tuesday, 28 September 2010 21:59:59 UTC

This archive was generated by hypermail 2.3.1 : Tuesday, 6 January 2015 20:43:45 UTC