Re: [moztw-general] 請幫忙檢查 HTML Parser 錯誤訊息的翻譯 from Peter Pin-Guang Chen on 2011-11-03 (public-html-ig-zh@w3.org from November 2011)

From: Peter Pin-Guang Chen <petercpg@mail.moztw.org>
Date: Thu, 3 Nov 2011 15:55:32 +0800
To: moztw-general@googlegroups.com
Cc: 中文HTML5同樂會ML <public-html-ig-zh@w3.org>
Message-ID: <CAPd3dB=RtBdPDQMROYBOA1RKV6iDQ=yT_MWfXE1b3VNufshsQA@mail.gmail.com>
再補充一下，Mozilla 的 dev-l10n 討論群組裡面也有人在提這件事，看來原本的英文都不見得讓人看得懂(汗)
http://groups.google.com/group/mozilla.dev.l10n/browse_thread/thread/edcd0eeffe0159d1


其他的，replies inline。

Kang-Hao (Kenny) Lu <kennyluck@w3.org> 於 2011年11月3日下午2:24 寫道：

> 幫 Peter 補充一下，原文應該是：http://hg.mozilla.org/mozilla-central
> /file/b8dd6f6f4207/dom/locales/en-US/chrome/layout/htmlparser.properties
> 目前的翻譯在：https://etherpad.mozilla.org/dom-htmlparser-properties-zh-tw
>
> (11/11/02 9:50), Peter Chen wrote:
> > Dears,
> >
> > 昨天 l10n repo 上突然多出了一百多句字串處理 HTML Parser 輸出錯誤訊息的部分[1]，
> > 我剛剛翻完了第一個版本，不過我預期應該會有一些翻譯錯誤或是翻的不夠好的地方，
> > 所以想請各位 (我想尤其是 Kenny 懂得應該比我多很多?) 來幫忙抓錯誤。
>
> 既然被點名了就給一些評論吧（大家都知道我意見很多了吧），首先回答這個問題：
>
> (11/11/02 14:40), Peter Chen wrote:
> > 我沒猜錯的話這東西應該會出現在錯誤主控台裡面....。
> >
> > 今明天等原本那個 bug 被編進 -central 裡面可以測試看看?
>
> 這是在「檢視原始碼」的時候，Firefox 幫忙找的 HTML 語法錯誤，它會給你紅字
> 然後你把游標懸浮在上面就會看到這些提示訊息。目前沒看到錯誤主控台裡有出現
> 這部份。翻譯的部份...
>
> 首先是常用字
>
> character — 翻字符好像是新趨勢？還是大陸用法？（我是蠻習慣講字符就是了）
> reference — 我會翻「引用」，不過沒太強烈的意見。
>

我沒有意見，這是參考 http://xml.ascc.net/zh/utf-8/gloss.html 翻譯的名詞表
W3C/WHATWG 好像沒有定義這些名詞的翻譯? 如果能確定一份出來我倒是不介意使用


> > errLtSlashGt=發現「</>」。可能造成的原因: 未跳脫的「<」（應該要跳脫成
> >「&lt;」） 或是不對應的結尾標籤。
>
> 這裡「不對應」原文是 mistyped，翻成「或是結尾標籤打錯了」怎麼樣？畢竟嚴
> 格上這不是對應不對應的問題。你打 </abc> 就不會出現這個錯了。
>

同意，翻成對應反而是錯的。

 > errCharRefLacksSemicolon=字元參引未由半形分號結束。
>
> 我會覺得「半形」是多餘的，尤其檢視原始碼本來就是給開發者看的。
>

同意。


> > errNoDigitsInNCR=字元參引當中沒有數字。
>
> 這裡原文是 "No digits in numeric character reference"。現在興趣小組規範
> 翻譯目前是用「數字型字符引用」。畢竟是專有名詞，最好一致一點，有不太同意
> 的意見的話一起討論一下。
>

跟前面一樣，如果中文興趣小組有翻的話我想我們可以中文小組翻出來的結果。


> > errNamelessDoctype=文件型別沒有名稱。
>
> 規範翻譯 QQ 群的意見是說這邊說「Doctype」不要翻了。順道一提，這是
> <!Doctype > 的狀況。
>
> > errBogusComment=偽造的註解。
>
> 這真的很難，不過畢竟有人看不懂還是改一下吧。這是 <!- a --> <? ?> <!-&
> --> 等等各種狀況的集合，功能上來講的話我建議翻成「註解語法不正確」就好
> 了。話說回來，HTML5 規範把這個詞當作名詞來用，所以的確可能需要一個專有名
> 詞...
>
> 「不正註解」怎麼樣？（很想直接翻「搞笑註解」之類的...）
>
> 這個詞喔，一般是用在比較「惡搞」 的地方，像是 <!-- 漏結尾就太不像惡搞
> 了，沒有 bogus 的感覺。一般是說 <meta charset=abc> 這種感覺。我不知道一
> 般會不會用「假」或是「擬」描述這種情形耶？
>

如果是翻譯成「無效的註解語法」呢?
Bogus 這個字的情況跟 astral「星空」、stray「雜亂」的情況有點像，太口語了。


> > errUnquotedAttributeLt=在一個沒有被引號包起來的屬性值當中發現「<」。可
> > 能造成的原因: 前面缺少「>」。
>
> 這是 <meta charset=utf-8<style>...</style> 的情形，從功能來看，與其寫
> 「缺少」，用「少打了」怎麼樣？後面類推。
>

我不確定是不是要這麼口語? 但我也不介意使用「少打了」。


> > errUnquotedAttributeGrave=在一個沒有被引號包起來的屬性值當中發現
> >「`」。可能造成的原因: 使用了不正確的符號作為註解。
>
> 這是 <meta charset=`utf-8`> 的情形，「使用不正確的引號字符」可能比較容易懂？
>

「`」是西方人的重音符號，所以我想不應該說是不正確的引號?


> > errUnquotedAttributeStartEquals=在一個沒有被引號包起來的屬性值的開頭發
> > 現「=」。可能造成的原因: 雜亂且重複的等號。
>
> 這是 <meta charset==utf-8> 或是 <mata charset= =utf-8> 的情形。怎麼形
> 容？我看說「多餘的等號」就好了。「雜亂」這個字...
>

同上。


> > errLtGt=發現了「>」。可能造成的原因: 未跳脫的「<」（應該要跳脫為
> >「&lt;」）或是把起始標籤打錯了。
>
> 這裡是「<>」才對，Peter 可能漏看了。這沒什麼爭議我就 Etherpad 先改了。
>

感謝 XD


> > errUnescapedAmpersandInterpretedAsCharacterReference=在「&」後面的字串
> > 被解譯為字元參引。（也許應該把「&」跳脫為「&amp;」。）
> > errNotSemicolonTerminated=附名的字元參引並未由分號結束。（也許應該把
> >「&」跳脫為「&amp;」。）
> > errNoNamedCharacterMatch=「&」並未起始一個字元參引。（也許應該把「&」
> > 跳脫為「&amp;」。）
>
> 這三個我花了很長的時間理解差異，到目前為止還不是很確定我知道哪個場合要用
> 哪個。不管怎麼樣 1) 建議把「附名的」拿掉，一般講字符引用如果沒特別提都是
> 講 &amp; 這種，數字型的那種（&#23;）再多加一個形容詞說明就好。2) 建議把
> 「在」拿掉「被解釋」改成「已被解釋為」，但是這裡靠這些字也解釋不清，請看
> 下面。
>
> 我講幾個... 有點恐怖的例子，大家可以想想看這裡要怎麼幫助使用者：
>
> 如果你在位址條打："data:text/html,&abc;" 你會看到螢幕出現 "&abc;" 基本上
> 就是「這個『&』並未起始一個字符引用」，這大概沒什麼問題。
>
> 如果你在位址條打："data:text/html,&lta;" 你會看到螢幕出現 "<a;" 這是因為
> "&lt"（注意！沒有 ";" ）被取代成 "<a;" 。但是這是極端...不容易理解的行
> 為。這個應該對應到「『&』後面的字串已被解譯為字符引用。」（雖然目前的逐
> 日建製版怪怪的）。這裡應該最好把被取代的字串 "&lt" 直接寫上來... 另外，
> 目前劃紅色的地方也怪怪的。總之祈禱開發者不要碰到這種狀況好了。另外一種想
> 法就是在這個時候給開發者「這個『&』並未起始一個字符引用」就好了。
>
> 更可怕的事，如果 "&lta;" 出現在屬性值裡，這就不會變成剛剛 "<a;" 而是
> "&lta;"！這裡目前是回到「這個『&』並未起始一個字元參引」，我想沒有問題。
>
> 如果屬性值只有 "&lt"，會出現「字符引用並未由分號結束。」，我想這個可以理
> 解。中間那種狀況真的是問題比較多一點，不曉得各位有什麼想法？（要不我看全
> 部寫成「這個『&』並未起始一個字符引用」好了...何況目前還有 bug）
>

同意把「在」這個贅字拿掉。
&lt 這種寫法應該是以往 IE 繼承過來的歷史共業...不過不知道 IE 9/10 修掉這個了沒?


> > errBogusDoctype=假造的文件型別。
>
> 同上，目前我想到最好的就是「文件型別語法不對」了。
>

我想到的是「無效的文件型別」？

> maybeErrSlashInEndTag=在結束標籤的結尾發現了雜散的「/」。
>
> </b /> 的情形，「在結束標籤的結尾發現了多餘的『/』」？
>

把雜散通通改成多餘的會不會有問題？


> > errNcrNonCharacter=字元參引被擴充到非字元範圍。
>
> 直接寫成「引用非字元字符」怎麼樣？其他類比。
>

同意。


> > errAstralNonCharacter=字元參引被擴充到非字元星光範圍。
>
> 嗚，我真的不知道怎麼形容 U+FFFF 以上的字符了，假如大家說是星光那就星光
> 吧。（放心，我想碰到這個東西的機率太低了）
>

我也不知道這應該怎麼用中文的語法解釋...
英文把它叫做星光、星芒是因為這些字很少用而且又離我們常用的很遠嗎 orz


> > errNcrSurrogate=字元參引擴充到代理範圍。
>
> 不知道怎麼形容代理對的其中一個，代理代碼點？
>
> > errNcrCr=數值字元參引擴充到換行符號。
>
> U+000D 或是俗稱 '\r'，我不曉得有沒有跟 '\n' 區隔的中文名字啦...
>

認真的解釋應該要把 CR 叫做印字頭歸位? 但我想這年頭應該沒必要這樣翻了。


> > errEofInPublicId=公用識別符當中出現了檔案結束符號。
>
> 「檔案結束造成公用辨識符的解析中斷」或是類似的句子，不用講「檔案結束符
> 號」之類的了吧？下面類推
>

同意。


> > errNcrUnassigned=字元參引擴充到一個永久未指派的程式點。
>
> 「程式點」→「代碼點」
>
> > errNcrZero=字元參引擴充到零。
>
> 「零」→「空字符」（一般怎麼稱呼 U+0000 NULL？）
>

就直接叫做 Null，或是空字符我想也可。

嗚，我先弄到這裡剛好一半好了。後面樹建構的部份大家也可以一起幫忙想一
> 想...這裡的確是跟規範用語相同比較好...
>
>
> (11/11/02 13:06), CQD wrote:
> > http://www.w3.org/TR/html5/tokenization.html#bogus-comment-state
> > 稍微看了一下，這個似乎跟 HTML5 規範 Parse 的狀態機如何切換處理輸入資料
> 的狀態有關。
> >
> > 發生 Parser Error 時會切換入 Bogus comment
> > state，從當字元到第一個「>」的全部字元都會被吃掉，如果沒有「>」的話就
> 一路吃到 EOF。
> >
> > 我猜在這個模式吃掉的字元會被 browser 丟掉，雖然不確定。
>
> 歡迎大家比較一下
>
>
> data:text/html,<!--a--><script>alert(document.childNodes[0].textContent)</script>
>
> 跟
>
>
> data:text/html,<!-a--><script>alert(document.childNodes[0].textContent)</script>
>
> 的不同。結論是未被吃掉，規範的句子是：
>
> [[
>
> Emit a comment token whose data is the concatenation of all the
> characters starting from and including the character that caused the
> state machine to switch into the bogus comment state, up to and
> including the character immediately before the last consumed character
>
> ]]
>
>
> (11/11/02 13:30), Bob Chao wrote:
> > 有疑問且在規範裡的東西或許可以丟 html5中文興趣小組討論一下
>
> 感謝引介，所以我直接 Cc 給中文興趣小組了 xd
>
>
>
>
>
> --
> 您已訂閱「Google 網上論壇」的「moztw-general: 摩茲將軍」群組，因此我們特別傳送這封郵件通知您。
> 如要在此群組張貼留言，請傳送電子郵件至 moztw-general@googlegroups.com。
> 如要取消訂閱此群組，請傳送電子郵件至 moztw-general+unsubscribe@googlegroups.com。
> 如需更多選項，請造訪此群組：http://groups.google.com/group/moztw-general?hl=zh-TW。
>
>
Received on Thursday, 3 November 2011 20:33:00 UTC