Re: 求助:關於Big5和Big5-HKSCS的問題

2012/4/17 Kang-Hao (Kenny) Lu <kennyluck@csail.mit.edu>:

>>> 或許開個 Google spreadsheet 大家上去幫忙人肉比對一下?
>> 歡迎抽空幫忙,目前就是[1]和[2]而已。不過我在想辦法造出新的(含有日文的)。
呵呵,我很好奇是因為樣本數差異的關係(google: 約有 797,000,000 項結果),
還是bing的「取向」離你(Kenny)我有距離,畢竟我沒在用bing的... :D

hkscs跟uao都有收big5倚天碼的部份,所以假名都不是問題,問題在日文漢字部份。
另外,從上次阿菲的survey看起來,中國海字集中收錄的編號⒈ ⒉ ⒊跟圖案♥,
到現在還有不少在用。這個部份也就只有uao能對了。

> 剛剛阿菲跟我講它這部份其實都做得差不多了,不過 .hk 裡面有七個他分不出來
> 的就請大家幫忙一下好了。可能需要人肉搜尋、推理:

> 1.
> http://www.cepa.com.hk/office/officeAdminFurnitureFactory.asp

> hkscs: 超<U+6822 栢>(香港)有限公司&nbsp;
> uao:   超<U+8063 聣>(香港)有限公司&nbsp;
> Link to Superb (HK) Limited <http://www.superbhk.com/>, which is dead.
用發音猜hkscs吧?

> 2.
> http://www.budaedu.org.hk/budaedu/qm-04.html
> hkscs: ,不許改革。彼預與其族叔祖楚�<U+48F3 䣳>翩A議其辦法。�<U+48F3 䣳>
> 翩A乃明理通人,極為贊成。遂於

> uao:   ,不許改革。彼預與其族叔祖楚�<U+92F6 鋶>翩A議其辦法。�<U+92F6 鋶>
> 翩A乃明理通人,極為贊成。遂於
標點衝碼?都錯?
http://www.minlun.org.tw/haihui/data/56/index.asp?t1=0&t2=6&t3=65
彼預與其族叔祖楚常公.議其辦法。常公.乃明理通人.極為贊成。

> 3.
> http://www.ychlccsc.edu.hk/info07.html
> hkscs: ng>內設可供燒製大型壁畫的陶<U+7AB0 窰>電動拉坯機、坭板機、真空混坭機
> uao:   ng>內設可供燒製大型壁畫的陶<U+8BD6 诖>電動拉坯機、坭板機、真空混坭機
> Typo of 密?
應該是窯的別字?(倉頡輸入?手寫輸入?)

> 4.
> http://www.budaedu.org.hk/budaedu/shwd-02.html
> hkscs: 《補史記‧三皇本紀》說:『太�<U+4C3B 䰻>]犧氏,風姓,代燧人氏繼天而王
> uao:   《補史記‧三皇本紀》說:『太�<U+7F37 缷>]犧氏,風姓,代燧人氏繼天而王
http://zh.wikisource.org/zh-hant/%E4%B8%89%E7%9A%87%E6%9C%AC%E7%B4%80
太皞,庖犧氏,風姓,代燧人氏繼天而王。
(這裡「王」作動詞) 這份來自維基文庫的似乎是從簡體轉來的,雖是utf8編碼,
跟其他google到的比起來似有錯漏。

http://continuation.prhs.ptc.edu.tw/tanjan/masters.htm
太昊庖犧氏,風姓。代燧人氏繼天而王。
http://www.tawa.tw/DiscriminationAndCalculusm_2.htm
太昊庖犧氏風姓代燧人氏繼天而王
http://data.book.hexun.com.tw/chapter-3665-2-3.shtml
太嗥庖犧氏風姓,代燧人氏繼天而王。
http://tongzi.blog.hexun.com.tw/40974323_d.html
太皞庖犧氏,風姓,代燧人氏繼天而王。
http://xn--fhqx4yz1dd20a.tw/html/92/555.html
太皋包犧氏,風姓,代燧人氏繼天而王。

「鍵盤考古學」還是有極限的... XD

> 5.
> http://www.htsps.edu.hk/Web/03_TeachLearn/chi.htm
這沒辦法...

> 6.
> http://www.mihk.hk/forum/thread-962765-1-1.html
> hkscs: t> 下1湯匙油燒熱鍋,爆香乾<U+27A53 𧩓>片,下芋頭略煮片刻,灒酒略拌勻
> uao:   t> 下1湯匙油燒熱鍋,爆香乾<U+E16A >片,下芋頭略煮片刻,灒酒略拌勻
> Same character in some fonts, but UAO uses PUA mapping. Possible typo.
Linux下看到相同字符,但來自不同的字型。

> 7.
> http://www.htsps.edu.hk/Web/03_TeachLearn/eng.htm
還是沒辦法...

> hkscs: t-family:標楷體'>趙<U+6667 晧>峻</span></p>
> uao:   t-family:標楷體'>趙<U+7BCF 篏>峻</span></p>
> Given name Chiu Ho Tsun: 趙晧峻 or 趙篏峻?

明顯看來,在.hk用hkscs沒有太大的爭議。


-- 
Best regards,
Yuan Chao

Received on Wednesday, 18 April 2012 06:36:34 UTC