W3C home > Mailing lists > Public > public-html-ig-zh@w3.org > April 2012

Re: 求助:關於Big5和Big5-HKSCS的問題

From: Philip Jägenstedt <philipj@opera.com>
Date: Wed, 11 Apr 2012 22:40:26 +0200
To: "Yuan Chao" <yuanchao@gmail.com>, "Timothy Chien" <timdream@gmail.com>
Cc: "public-html-ig-zh@w3.org" <public-html-ig-zh@w3.org>, Øistein E. Andersen <liszt@coq.no>, "public-html-ig-zh@w3.org" <public-html-ig-zh@w3.org>
Message-ID: <op.wcmbpo2dsr6mfa@localhost.localdomain>
On Tue, 10 Apr 2012 16:49:50 +0200, Yuan Chao <yuanchao@gmail.com> wrote:

> 2012/4/9 Philip Jägenstedt <philipj@opera.com>:
>
> Hi Philip,
>
>> IE瀏覽器一直只支持一種Big5編碼而其它瀏覽器支持兩種:Big5和Big5-HKSCS。問題是好多設定<meta
>> charset="big5">的網頁仍然使用屬於Big5-HKSCS的字符,而在IE會顯示正常。因此,我們在WHATWG正在研究怎麼定義一個統一Big5和Big5-HKSCS的編碼:
>
> 老實說,要直接把Big5-HKSCS直接併入Big5應該是會有問題的。在台灣普遍有個
> de facto的外字庫:中國海字集,確定有一部份是跟Big5-HKSCS重疊但不相容的。
>
> 稍微google了一下舊資料,多年來在firefox已經有patch讓private  
> area有了對應:
> https://bugzilla.mozilla.org/show_bug.cgi?id=310299

> 也許WHATWG可以有類似的作法?

On Tue, 10 Apr 2012 18:45:01 +0200, Timothy Chien <timdream@gmail.com>  
wrote:

> Firefox 的作法是讓 u2b 和 b2u 兩個表不相等:unicode to big5 用最保守的  
> CP950,big5 to
> unicode 則用最大的 set big5-uao。
>
> 我想講的跟前面 Yuao 說的一樣,主要的問題是目前通用的 big5 都不是互相的  
> subset,所以要 unify
> 不是可行的事情。big5-uao 作為 Telnet BBS 的外字集,也是跟 Big5-HKSCS  
> 重疊但不相容的。
>
> 關於 Mozilla 針對 Big5 處理的經驗,有前人寫的  
> http://moztw.org/docs/big5/ 可供參考。

Yuan, Timothy,

關於Big5-HKSCS跟Big5-UAO的重疊問題,我們用了dotnetdotcom.org的資料找了有可能出問題的網頁:<http://lists.whatwg.org/htdig.cgi/whatwg-whatwg.org/2012-April/035370.html>、<http://lists.w3.org/Archives/Public/public-html-ig-zh/2012Apr/0006.html>。統一是會影響一些網頁,不過看來Firefox的做法影響更多網頁。如果我們的分析不準確或有更好的數據源,那應該再研究……

此外,該標準主要是針對瀏覽器,所以不會直接影響Web之外的Big5用法。

我估計我們這麼做是唯一的選擇,因為IE一直只支持一種Big5。

-- 
Philip Jägenstedt
Core Developer
Opera Software
Received on Wednesday, 11 April 2012 20:41:07 UTC

This archive was generated by hypermail 2.3.1 : Tuesday, 6 January 2015 20:43:50 UTC