- From: pingooo <ping.nsr.yeh@gmail.com>
- Date: Sat, 2 Oct 2010 16:10:15 +0800
- To: Yuan Chao <yuanchao@gmail.com>
- Cc: John Hax <johnhax@gmail.com>, oldcat <blog.oc@gmail.com>, Ethan Chen <chief@ethantw.net>, 中文HTML5同樂會ML <public-html-ig-zh@w3.org>
- Message-ID: <AANLkTikx9Pxr8Oc4zxppWWKxBkOzkWhfdW69JLDxL8Wi@mail.gmail.com>
pingooo <ping.nsr.yeh@gmail.com> 於 2010年10月2日下午4:08 寫道: > ruby 對搜尋引擎的影響是在斷字吧... 下面這個句子 > > 「有 ruby 的<ruby>中<rp>(<rt>ㄓㄨㄥ<rp>)</rp>文<rp>(<rt>ㄨㄣˊ<rp>)</ruby>看起來不錯。」 > > 如果搜尋引擎在建索引時不把 <rp> 和 <rt> 的部分略過,恐怕就認不出有「中文」這個詞,搜尋「中文」就找不到了。但這聽起來是克服得了的事。 > > 我也不太確定用 ruby 來標注全文的注音是最好的做法,就算有 author tool 解決製作端的困難,這樣的文字顯示在瀏覽器裡 copy & > paste 到其他應用程式會變成怎樣?我在 Mac 上用 Chrome 和 TextEdit 試了一下,貼出來變成下面這樣: > > 有 ruby 的中 > > ㄓㄨㄥ > > 文 > > ㄨㄣˊ > > 看起來不錯。 > 我是說看起來很糟糕!該去睡午覺了。 XD > > copy & paste 牽涉到的層面更廣,我不熟桌面系統,不知有沒有簡單的解決方法。 > > Yuan Chao <yuanchao@gmail.com> 於 2010年10月1日下午5:04 寫道: > > 2010/9/30 John Hax <johnhax@gmail.com> >> >> ruby并不是仅仅用于注音,也有其他用途,例如古书里的注。 >>> >>> 关键问题是,你想要表达什么。如果小学课本,它就是要标注音的。那花再多的时间也是应该的。 >>> >>> 另外日本的例子里,还有在报纸上标注假名的(因为有些汉字普通人不会读),这个就不会太多。不过在中国的出版物里没有这个习惯。 >>> >> 其實ruby本來就是日本人提出來,用來標浮假名用的。 XD >> 倒是拿來當注釋這點,還有拿來標書名/專名號,我覺得是很好的想法,也有助於語意。 :) >> 因為總覺得拿來標全文注音,根本就不是ruby的原意,對搜尋引擎來說也是個負擔。 >> >> >> 2010/9/29 oldcat <blog.oc@gmail.com> >>> >>> 不好意思,我想冒昧問一下: >>>> >>>> 像這樣用css的方式排注音,不知道排一篇一千字的文章需要花多少時間? >>>> >>>> 如果這是個蠢問題,請大家原諒。 >>>> >>>> oc >>>> >>>> >>>> >>>> >>>> 2010/9/28 Ethan Chen <chief@ethantw.net> >>>> >>>>> https://addons.mozilla.org/en-US/firefox/addon/6812/ >>>>> 這是我在 Firefox 上測試的結果: >>>>> [image: Content] >>>>> 呃,我有把稍早提到的 CSS 和 <b class="proper-noun"> 都去掉。不知道這是什麼原因....... >>>>> >>>>> >>>>> 關於聲調號的部份,那份文件沒有提到該怎麼實作,但光按現行的 CSS 偽類應該做不出來。不過 W3C 提到「 ruby on >>>>> ruby」,所以可不可以是... >>>>> >>>>> <ruby> >>>>> >>>>> <rb>白</rb> >>>>> >>>>> <rb>雪</rb> >>>>> >>>>> <rb>姑</rb> >>>>> >>>>> <rb>娘</rb> >>>>> >>>>> <rb>兒</rb> >>>>> >>>>> >>>>> <rt>ㄅㄞ<rt>ˊ</rt></rt> >>>>> >>>>> <rt>ㄒㄩㄝ<rt>ˇ</rt></rt> >>>>> >>>>> <rt>ㄍㄨ</rt> >>>>> >>>>> <rt rbspan="2"><rt>˙</rt>ㄋㄧㄤㄦ</rt> >>>>> >>>>> </ruby> >>>>> >>>>> 就是 <rt> 裡再用一個 <rt> 來包裹聲調。 >>>>> >>>>> 大家應該都同意在 :lang(zh-tw) >>>>> 的情況下,注音符號應該預設放在字的右邊並寫成直式。但如果想把注音符號放在字上面寫成橫式呢(排版的需求之類的)?下面這個方法不曉得對不對: >>>>> >>>>> ruby rt { writing-mode: lr-tb; } >>>>> >>>>> >>>>> >>>>> >>>>> 在 Sep 28, 2010 9:46 PM 時, Yuan Chao 寫到: >>>>> >>>>> 2010/9/28 Ethan Chen <chief@ethantw.net>: >>>>> >>>>> 回到上面的圖片,關於文字間距的部份當然是 Safari 的結果比較正確,以 <rt> 的寬度來決定字寬。 >>>>> >>>>> >>>>> 看起來 Firefox 的文字間隔是有問題的,兩個字的ruby基本上都黏在一起。畢竟注音不像假名,並不是一個符號一個音。 >>>>> >>>>> >>>>> 這個問題可以用 margin: 0 Xem; 來解決,所以我覺得倒是還好。而且 Firefox 上的結果是我自己拿 CSS >>>>> >>>>> 實作的,可能問題比較多。還請指教。 >>>>> >>>>> 剛好看了OOO提到的舊XHTML規格中的ruby支援,中文注音的聲調符應該在最後韻母的右上角, >>>>> 而不是同樣大小的方塊字。 >>>>> >>>>> 從舊的XHTML ruby addon的連結,有個新的addon是支援HTML5 ruby的。 >>>>> https://addons.mozilla.org/en-US/firefox/addon/6812/ >>>>> 可以麻煩比較一下嗎? >>>>> >>>>> 另外,一直有個問題:「ㄧ」這個注音,橫書的時候到底應該打成直的還是橫的?就方塊字來說,字間距都是一樣沒有省到。 >>>>> >>>>> >>>>> 請看教育部關於注音符號〈總表〉的內容 [1]。「ㄧ」在橫寫時的確是直(豎)的筆劃,看來這只是規定,並不是為了省間距喔。 >>>>> >>>>> 又,這其實不是「打」的問題,unicode 沒有為這個符號收錄直寫、橫寫兩個字符,怎麼顯示其實是看字體(圖片上的字體是我拿「教育部標準楷書 >>>>> >>>>> [2]」取出注音符號的部份後,修改「ㄧ」字為直豎而成,再用 @font-family >>>>> >>>>> 鑲入網頁)。所以目前技術上的解法,只能拿兩個字體分別顯示橫寫與直寫。又為了字體風格一致,可能得編好之後用 @font-family >>>>> >>>>> 鑲入。目前教育部標準楷書是「創用 CC 姓名標示-禁止改作 3.0 >>>>> >>>>> 台灣」授權,只能寫信去要求教育部修改並為我們提出注音符號,或請教育部給別的授權。Google 跟文泉驛的 Droid Sans >>>>> Fallback >>>>> >>>>> 也是不錯的選擇,提出注音符號之後,也頂多 20, 30kb*2。 >>>>> >>>>> 了解。 >>>>> 只是unicode沒有收,新建字是沒有流通性的。 >>>>> >>>>> 難怪教育部辭典網頁下面,提供注音輸入的地方,用的是橫的ㄧ。 >>>>> 而辭典內標示的注音,用的是全形"column"符號。(很醜) >>>>> >>>>> >>>>> 又想到雙音節的漢字,類似「廿、浬」這樣的字出現在一篇標註注音的文章裡頭時,該怎麼標音?現在會全文注音的也只有國小課本,但印象中小學還沒教到這種程度的字咧。 >>>>> >>>>> >>>>> 根據教育部國語辭典: >>>>> >>>>> 廿 注音一式 ㄋ|ㄢˋ >>>>> >>>>> >>>>> 浬 注音一式 ㄌ|ˇ >>>>> >>>>> >>>>> 可是如果是在得念「二十」和「海里」的時候呢? >>>>> >>>>> >>>>> 「大家好,我今年廿三歲。」 >>>>> >>>>> >>>>> 這...不會有人說「ㄋㄧㄢˋ(niàn)ㄙㄢ(sān)」吧,lol。 >>>>> >>>>> >>>>> 所以說小弟寫這段啊! :) >>>>> >>>>> 就以前看過日文的做法是,就把所有的音節都塞進去,前後字距依ruby調整。但馬上又會遇到上述ruby斷字的問題。 >>>>> >>>>> >>>>> http://www.edu.tw/files/site_content/M0001/juyin/tt1.htm?open >>>>> >>>>> http://www.edu.tw/mandr/content.aspx?site_content_sn=3591 >>>>> >>>>> 看到 "創用CC「姓名標示-禁止改作3.0臺灣版」授權" 真是欣慰, >>>>> 比之前那個不准散佈還要簽授權書好多了。 >>>>> 但是缺點就是改了就不能散佈了。 >>>>> >>>>> >>>>> >>>>> >>>>> 在 Sep 28, 2010 8:21 PM 時, Yuan Chao 寫到: >>>>> >>>>> >>>>> 2010/9/28 Ethan Chen <chief@ethantw.net> >>>>> >>>>> >>>>> 大家好,我也來發篇討論吧。這是我在實際應用上遇到的問題。 >>>>> >>>>> 下面分別是 Webkit (Safari,上圖) 原生支援的 <ruby> 與 Firefox(下圖)以 CSS 實作的 <ruby> 。 >>>>> >>>>> >>>>> 不好意思,我這邊看不到「上圖」。 >>>>> >>>>> 另外,一直有個問題:「ㄧ」這個注音,橫書的時候到底應該打成直的還是橫的?就方塊字來說,字間距都是一樣沒有省到。 >>>>> >>>>> >>>>> 回到上面的圖片,關於文字間距的部份當然是 Safari 的結果比較正確,以 <rt> 的寬度來決定字寬。 >>>>> >>>>> >>>>> 看起來 Firefox 的文字間隔是有問題的,兩個字的ruby基本上都黏在一起。畢竟注音不像假名,並不是一個符號一個音。 >>>>> >>>>> >>>>> >>>>> p.s. >>>>> >>>>> >>>>> 又想到雙音節的漢字,類似「廿、浬」這樣的字出現在一篇標註注音的文章裡頭時,該怎麼標音?現在會全文注音的也只有國小課本,但印象中小學還沒教到這種程度的字咧。 >>>>> >>>>> >>>>> 根據教育部國語辭典: >>>>> >>>>> 廿 注音一式 ㄋ|ㄢˋ >>>>> >>>>> 浬 注音一式 ㄌ|ˇ >>>>> >>>>> >>>>> 就以前看過日文的做法是,就把所有的音節都塞進去,前後字距依ruby調整。但馬上又會遇到上述ruby斷字的問題。 >>>>> >>>>> >>>>> >>>>> -- >>>>> >>>>> Best regards, >>>>> >>>>> Yuan Chao >>>>> >>>>> >>>>> >>>>> >>>>> >>>>> >>>>> -- >>>>> Best regards, >>>>> Yuan Chao >>>>> >>>>> >>>>> >>>> >>> >> >> >> -- >> Best regards, >> Yuan Chao >> > >
Received on Saturday, 2 October 2010 08:18:31 UTC