- From: Philip Jägenstedt <philipj@opera.com>
- Date: Wed, 11 Apr 2012 22:40:26 +0200
- To: "Yuan Chao" <yuanchao@gmail.com>, "Timothy Chien" <timdream@gmail.com>
- Cc: "public-html-ig-zh@w3.org" <public-html-ig-zh@w3.org>, Øistein E. Andersen <liszt@coq.no>, "public-html-ig-zh@w3.org" <public-html-ig-zh@w3.org>
On Tue, 10 Apr 2012 16:49:50 +0200, Yuan Chao <yuanchao@gmail.com> wrote: > 2012/4/9 Philip Jägenstedt <philipj@opera.com>: > > Hi Philip, > >> IE瀏覽器一直只支持一種Big5編碼而其它瀏覽器支持兩種:Big5和Big5-HKSCS。問題是好多設定<meta >> charset="big5">的網頁仍然使用屬於Big5-HKSCS的字符,而在IE會顯示正常。因此,我們在WHATWG正在研究怎麼定義一個統一Big5和Big5-HKSCS的編碼: > > 老實說,要直接把Big5-HKSCS直接併入Big5應該是會有問題的。在台灣普遍有個 > de facto的外字庫:中國海字集,確定有一部份是跟Big5-HKSCS重疊但不相容的。 > > 稍微google了一下舊資料,多年來在firefox已經有patch讓private > area有了對應: > https://bugzilla.mozilla.org/show_bug.cgi?id=310299 > 也許WHATWG可以有類似的作法? On Tue, 10 Apr 2012 18:45:01 +0200, Timothy Chien <timdream@gmail.com> wrote: > Firefox 的作法是讓 u2b 和 b2u 兩個表不相等:unicode to big5 用最保守的 > CP950,big5 to > unicode 則用最大的 set big5-uao。 > > 我想講的跟前面 Yuao 說的一樣,主要的問題是目前通用的 big5 都不是互相的 > subset,所以要 unify > 不是可行的事情。big5-uao 作為 Telnet BBS 的外字集,也是跟 Big5-HKSCS > 重疊但不相容的。 > > 關於 Mozilla 針對 Big5 處理的經驗,有前人寫的 > http://moztw.org/docs/big5/ 可供參考。 Yuan, Timothy, 關於Big5-HKSCS跟Big5-UAO的重疊問題,我們用了dotnetdotcom.org的資料找了有可能出問題的網頁:<http://lists.whatwg.org/htdig.cgi/whatwg-whatwg.org/2012-April/035370.html>、<http://lists.w3.org/Archives/Public/public-html-ig-zh/2012Apr/0006.html>。統一是會影響一些網頁,不過看來Firefox的做法影響更多網頁。如果我們的分析不準確或有更好的數據源,那應該再研究…… 此外,該標準主要是針對瀏覽器,所以不會直接影響Web之外的Big5用法。 我估計我們這麼做是唯一的選擇,因為IE一直只支持一種Big5。 -- Philip Jägenstedt Core Developer Opera Software
Received on Wednesday, 11 April 2012 20:41:07 UTC