求助:關於Big5和Big5-HKSCS的問題

各位好,

IE瀏覽器一直只支持一種Big5編碼而其它瀏覽器支持兩種:Big5和Big5-HKSCS。問題是好多設定<meta  
charset="big5">的網頁仍然使用屬於Big5-HKSCS的字符,而在IE會顯示正常。因此,我們在WHATWG正在研究怎麼定義一個統一Big5和Big5-HKSCS的編碼:<http://dvcs.w3.org/hg/encoding/raw-file/tip/Overview.html#big5>

還有一些存在的問題,希望這裏有人能幫我們研究一下……

1.  
我在<http://lists.whatwg.org/htdig.cgi/whatwg-whatwg.org/2012-April/035370.html>分析了一些有編碼問題的網頁。結論是準確的嗎?粵語和古文的例子是最需要關注的。

2.  
我們在<http://lists.whatwg.org/htdig.cgi/whatwg-whatwg.org/2012-April/035389.html>討論了兩個不確定的映射:

C6CD =>
opera-hk: U+2F33 ⼳
firefox: U+5E7A 幺
chrome: U+F6DD 
firefox-hk: U+5E7A 幺
opera: U+2F33 ⼳
chrome-hk: U+2F33 ⼳
internetexplorer: U+F6DD 
hkscs-2008: <U+2F33> ⼳

F9FE =>
opera-hk: U+FFED ■
firefox: U+2593 ▓
chrome: U+2593 ▓
firefox-hk: U+2593 ▓
opera: U+2593 ▓
chrome-hk: U+FFED ■
internetexplorer: U+2593 ▓
hkscs-2008: <U+FFED> ■

我目前的想法是把C6CD映射成U+5E7A、F9FE映射成U+2593。有誰知道為什麼官方的HKSCS-2008不是這麼定義的嗎?

3. 有100個重複的Unicode碼需要反向映射,其中有8個我們還沒確定的:

U+5EF4 => C6CF 或 FBFD
U+65E0 => C6D3 或 FCD3
U+7676 => C6D5 或 FEC1
U+96B6 => C6D7 或 90C4

U+255E => F9E9 或 A2A5
U+256A => F9EA 或 A2A6
U+2561 => F9EB 或 A2A7
U+2550 => F9F9 或 A2A4

4.  
微軟的HKSCS細明體包括22個HKSCS-2008未定義的字符:<http://people.opera.com/philipj/2012/04/08/big5-mingliu-hkscs.png>

這些字的來源是什麼?我在Unihan都找不到呢……

謝謝!

-- 
Philip Jägenstedt
Core Developer
Opera Software

Received on Monday, 9 April 2012 11:41:18 UTC