Re: 求助:關於Big5和Big5-HKSCS的問題

On Wed, 18 Apr 2012 08:35:39 +0200, Yuan Chao <yuanchao@gmail.com> wrote:

> 2012/4/17 Kang-Hao (Kenny) Lu <kennyluck@csail.mit.edu>:
>
>>>> 或許開個 Google spreadsheet 大家上去幫忙人肉比對一下?
>>> 歡迎抽空幫忙,目前就是[1]和[2]而已。不過我在想辦法造出新的(含有日文的)。
> 呵呵,我很好奇是因為樣本數差異的關係(google: 約有 797,000,000 項結果),
> 還是bing的「取向」離你(Kenny)我有距離,畢竟我沒在用bing的... :D
>
> hkscs跟uao都有收big5倚天碼的部份,所以假名都不是問題,問題在日文漢字部份。
> 另外,從上次阿菲的survey看起來,中國海字集中收錄的編號⒈ ⒉ ⒊跟圖案♥,
> 到現在還有不少在用。這個部份也就只有uao能對了。
>
>> 剛剛阿菲跟我講它這部份其實都做得差不多了,不過 .hk 裡面有七個他分不出來
>> 的就請大家幫忙一下好了。可能需要人肉搜尋、推理:
>
>> 1.
>> http://www.cepa.com.hk/office/officeAdminFurnitureFactory.asp

>
>> hkscs: 超<U+6822 栢>(香港)有限公司&nbsp;
>> uao:   超<U+8063 聣>(香港)有限公司&nbsp;
>> Link to Superb (HK) Limited <http://www.superbhk.com/>, which is dead.
> 用發音猜hkscs吧?
>
>> 2.
>> http://www.budaedu.org.hk/budaedu/qm-04.html

>> hkscs: ,不許改革。彼預與其族叔祖楚�<U+48F3 䣳>翩A議其辦法。�<U+48F3 䣳>
>> 翩A乃明理通人,極為贊成。遂於
>
>> uao:   ,不許改革。彼預與其族叔祖楚�<U+92F6 鋶>翩A議其辦法。�<U+92F6 鋶>
>> 翩A乃明理通人,極為贊成。遂於
> 標點衝碼?都錯?
> http://www.minlun.org.tw/haihui/data/56/index.asp?t1=0&t2=6&t3=65

> 彼預與其族叔祖楚常公.議其辦法。常公.乃明理通人.極為贊成。
>
>> 3.
>> http://www.ychlccsc.edu.hk/info07.html

>> hkscs: ng>內設可供燒製大型壁畫的陶<U+7AB0  
>> 窰>電動拉坯機、坭板機、真空混坭機
>> uao:   ng>內設可供燒製大型壁畫的陶<U+8BD6  
>> 诖>電動拉坯機、坭板機、真空混坭機
>> Typo of 密?
> 應該是窯的別字?(倉頡輸入?手寫輸入?)
>
>> 4.
>> http://www.budaedu.org.hk/budaedu/shwd-02.html

>> hkscs: 《補史記‧三皇本紀》說:『太�<U+4C3B  
>> 䰻>]犧氏,風姓,代燧人氏繼天而王
>> uao:   《補史記‧三皇本紀》說:『太�<U+7F37  
>> 缷>]犧氏,風姓,代燧人氏繼天而王
> http://zh.wikisource.org/zh-hant/%E4%B8%89%E7%9A%87%E6%9C%AC%E7%B4%80

> 太皞,庖犧氏,風姓,代燧人氏繼天而王。
> (這裡「王」作動詞) 這份來自維基文庫的似乎是從簡體轉來的,雖是utf8編碼,
> 跟其他google到的比起來似有錯漏。
>
> http://continuation.prhs.ptc.edu.tw/tanjan/masters.htm

> 太昊庖犧氏,風姓。代燧人氏繼天而王。
> http://www.tawa.tw/DiscriminationAndCalculusm_2.htm

> 太昊庖犧氏風姓代燧人氏繼天而王
> http://data.book.hexun.com.tw/chapter-3665-2-3.shtml

> 太嗥庖犧氏風姓,代燧人氏繼天而王。
> http://tongzi.blog.hexun.com.tw/40974323_d.html
> 太皞庖犧氏,風姓,代燧人氏繼天而王。
> http://xn--fhqx4yz1dd20a.tw/html/92/555.html

> 太皋包犧氏,風姓,代燧人氏繼天而王。
>
> 「鍵盤考古學」還是有極限的... XD
>
>> 5.
>> http://www.htsps.edu.hk/Web/03_TeachLearn/chi.htm

> 這沒辦法...
>
>> 6.
>> http://www.mihk.hk/forum/thread-962765-1-1.html

>> hkscs: t> 下1湯匙油燒熱鍋,爆香乾<U+27A53  
>> 𧩓>片,下芋頭略煮片刻,灒酒略拌勻
>> uao:   t> 下1湯匙油燒熱鍋,爆香乾<U+E16A  
>> >片,下芋頭略煮片刻,灒酒略拌勻
>> Same character in some fonts, but UAO uses PUA mapping. Possible typo.
> Linux下看到相同字符,但來自不同的字型。
>
>> 7.
>> http://www.htsps.edu.hk/Web/03_TeachLearn/eng.htm

> 還是沒辦法...
>
>> hkscs: t-family:標楷體'>趙<U+6667 晧>峻</span></p>
>> uao:   t-family:標楷體'>趙<U+7BCF 篏>峻</span></p>
>> Given name Chiu Ho Tsun: 趙晧峻 or 趙篏峻?
>
> 明顯看來,在.hk用hkscs沒有太大的爭議。

非常謝謝!

我已經更新了HK樣本的分類:

https://gitorious.org/whatwg/big5/commit/16bd9738500608569bef908c57e04522a31ed332


-- 
Philip Jägenstedt
Core Developer
Opera Software

Received on Wednesday, 18 April 2012 10:37:05 UTC