Re: 字符编码 from Ben Luo on 2011-05-09 (public-html-ig-zh@w3.org from May 2011)

From: Ben Luo <benluo@gmail.com>
Date: Mon, 9 May 2011 11:05:23 +0800
To: Timothy Chien <timdream@gmail.com>
Cc: public-html-ig-zh@w3.org
Message-ID: <BANLkTi=1+cH2s4J8i6c+EBBAXEAXXmFX1g@mail.gmail.com>

那也就是说 browser 在载入js文件的时候会自动转换成 UCS-2？它是怎么自动判断文件本身的编码呢？

2011/5/9 Timothy Chien <timdream@gmail.com>:
> 那是記憶體內部處理文字的標準吧？與檔案的編碼無關。
> 意思是說，
>
> ('字').charCodeAt(0)
>
> 會傳回 UCS-2 code point。
>
>
> 不過後果就是 UCS-2 塞不進去的 Unicode code point，像是 Ext-B 的漢字，
> 在 Javascript 裡面會被拆成兩個字元，這時要找到真正的 Unicode code point 就要把兩個字元的字碼都讀出來處理：
>
> https://developer.mozilla.org/en/JavaScript/Reference/Global_Objects/String/charCodeAt#Example_2.3a_Fixing_charCodeAt_to_handle_non-Basic-Multilingual-Plane_characters_if_their_presence_earlier_in_the_string_is_unknown
>
> 算是在電腦文字處理發展史上，在節省記憶體 vs 容納所有字元之間目前大家選擇的界線。

Received on Monday, 9 May 2011 03:06:10 UTC