- From: Philip Jägenstedt <philipj@opera.com>
- Date: Wed, 18 Apr 2012 12:36:27 +0200
- To: "Kang-Hao (Kenny) Lu" <kennyluck@csail.mit.edu>, "Yuan Chao" <yuanchao@gmail.com>
- Cc: "Bob Chao" <bobchao@gmail.com>, W3C HTML5 中文興趣小組 <public-html-ig-zh@w3.org>
On Wed, 18 Apr 2012 08:35:39 +0200, Yuan Chao <yuanchao@gmail.com> wrote: > 2012/4/17 Kang-Hao (Kenny) Lu <kennyluck@csail.mit.edu>: > >>>> 或許開個 Google spreadsheet 大家上去幫忙人肉比對一下? >>> 歡迎抽空幫忙,目前就是[1]和[2]而已。不過我在想辦法造出新的(含有日文的)。 > 呵呵,我很好奇是因為樣本數差異的關係(google: 約有 797,000,000 項結果), > 還是bing的「取向」離你(Kenny)我有距離,畢竟我沒在用bing的... :D > > hkscs跟uao都有收big5倚天碼的部份,所以假名都不是問題,問題在日文漢字部份。 > 另外,從上次阿菲的survey看起來,中國海字集中收錄的編號⒈ ⒉ ⒊跟圖案♥, > 到現在還有不少在用。這個部份也就只有uao能對了。 > >> 剛剛阿菲跟我講它這部份其實都做得差不多了,不過 .hk 裡面有七個他分不出來 >> 的就請大家幫忙一下好了。可能需要人肉搜尋、推理: > >> 1. >> http://www.cepa.com.hk/office/officeAdminFurnitureFactory.asp > >> hkscs: 超<U+6822 栢>(香港)有限公司 >> uao: 超<U+8063 聣>(香港)有限公司 >> Link to Superb (HK) Limited <http://www.superbhk.com/>, which is dead. > 用發音猜hkscs吧? > >> 2. >> http://www.budaedu.org.hk/budaedu/qm-04.html >> hkscs: ,不許改革。彼預與其族叔祖楚�<U+48F3 䣳>翩A議其辦法。�<U+48F3 䣳> >> 翩A乃明理通人,極為贊成。遂於 > >> uao: ,不許改革。彼預與其族叔祖楚�<U+92F6 鋶>翩A議其辦法。�<U+92F6 鋶> >> 翩A乃明理通人,極為贊成。遂於 > 標點衝碼?都錯? > http://www.minlun.org.tw/haihui/data/56/index.asp?t1=0&t2=6&t3=65 > 彼預與其族叔祖楚常公.議其辦法。常公.乃明理通人.極為贊成。 > >> 3. >> http://www.ychlccsc.edu.hk/info07.html >> hkscs: ng>內設可供燒製大型壁畫的陶<U+7AB0 >> 窰>電動拉坯機、坭板機、真空混坭機 >> uao: ng>內設可供燒製大型壁畫的陶<U+8BD6 >> 诖>電動拉坯機、坭板機、真空混坭機 >> Typo of 密? > 應該是窯的別字?(倉頡輸入?手寫輸入?) > >> 4. >> http://www.budaedu.org.hk/budaedu/shwd-02.html >> hkscs: 《補史記‧三皇本紀》說:『太�<U+4C3B >> 䰻>]犧氏,風姓,代燧人氏繼天而王 >> uao: 《補史記‧三皇本紀》說:『太�<U+7F37 >> 缷>]犧氏,風姓,代燧人氏繼天而王 > http://zh.wikisource.org/zh-hant/%E4%B8%89%E7%9A%87%E6%9C%AC%E7%B4%80 > 太皞,庖犧氏,風姓,代燧人氏繼天而王。 > (這裡「王」作動詞) 這份來自維基文庫的似乎是從簡體轉來的,雖是utf8編碼, > 跟其他google到的比起來似有錯漏。 > > http://continuation.prhs.ptc.edu.tw/tanjan/masters.htm > 太昊庖犧氏,風姓。代燧人氏繼天而王。 > http://www.tawa.tw/DiscriminationAndCalculusm_2.htm > 太昊庖犧氏風姓代燧人氏繼天而王 > http://data.book.hexun.com.tw/chapter-3665-2-3.shtml > 太嗥庖犧氏風姓,代燧人氏繼天而王。 > http://tongzi.blog.hexun.com.tw/40974323_d.html > 太皞庖犧氏,風姓,代燧人氏繼天而王。 > http://xn--fhqx4yz1dd20a.tw/html/92/555.html > 太皋包犧氏,風姓,代燧人氏繼天而王。 > > 「鍵盤考古學」還是有極限的... XD > >> 5. >> http://www.htsps.edu.hk/Web/03_TeachLearn/chi.htm > 這沒辦法... > >> 6. >> http://www.mihk.hk/forum/thread-962765-1-1.html >> hkscs: t> 下1湯匙油燒熱鍋,爆香乾<U+27A53 >> 𧩓>片,下芋頭略煮片刻,灒酒略拌勻 >> uao: t> 下1湯匙油燒熱鍋,爆香乾<U+E16A >> >片,下芋頭略煮片刻,灒酒略拌勻 >> Same character in some fonts, but UAO uses PUA mapping. Possible typo. > Linux下看到相同字符,但來自不同的字型。 > >> 7. >> http://www.htsps.edu.hk/Web/03_TeachLearn/eng.htm > 還是沒辦法... > >> hkscs: t-family:標楷體'>趙<U+6667 晧>峻</span></p> >> uao: t-family:標楷體'>趙<U+7BCF 篏>峻</span></p> >> Given name Chiu Ho Tsun: 趙晧峻 or 趙篏峻? > > 明顯看來,在.hk用hkscs沒有太大的爭議。 非常謝謝! 我已經更新了HK樣本的分類: https://gitorious.org/whatwg/big5/commit/16bd9738500608569bef908c57e04522a31ed332 -- Philip Jägenstedt Core Developer Opera Software
Received on Wednesday, 18 April 2012 10:37:05 UTC