Re: 私名號和書名號 from Jedi on 2010-08-26 (public-html-ig-zh@w3.org from August 2010)

From: Jedi <jedilin@gmail.com>
Date: Thu, 26 Aug 2010 17:52:04 +0800
To: public-html-ig-zh@w3.org
Message-ID: <AANLkTinuNwqWWz06tknUzaR=6d5bBekP1KmwNk2ph0ym@mail.gmail.com>

2010/8/26 oldcat <blog.oc@gmail.com>:
>> > 二、如果需要語意，「引號」和《書名號》完全可以處理，對「
>> > 英國倫敦」這樣的例子來說，搜尋引擎老早就區隔得很準確了；
>> 事實上不是，因為搜尋引擎不會知道這裡的「英國」是不是一個人名、「倫敦」是不是一本書
> 你的意思是知道是個專有名詞還不夠，要更準確地知道是人名、國名
> 山川名、河流名、海洋名……我們需要給每一種東西一個個別的語意
> 標籤？
>
> oc

簡短的回答：

不是。我們現在只需要區分出著作名稱跟專有名詞的語意。

比較長的回答：

我沒有理解錯誤的話，TBL（Tim Berners-Lee）長久以來一直有個夢想叫做語意網（Semantic Web），
確實是想要精確地知道每個東西個別的語意為何。
前些日子 mmdays.com 有一篇在講 facebook 的大陰謀的文章，剛好有很淺白地說明了語意網是怎麼一回事 [1]

而實際上 HTML 4.01 的語意標籤仍然不夠，所以才會有微格（Microformats）[2] 這樣的實作嘗試
然而實務上過多的標籤並不好用，所以設計標準上就是一堆標籤的競爭與取捨，
有哪些標籤夠重要，就會留下來；有哪些標籤夠相似，就會被合併。諸如此類。

另一個現實則是，現在主流的瀏覽器其實很有可能會跳過所有的標點符號，僅針對剩下來的文字做索引，
所以 Google 真的沒辦法從「、」、《、》等符號來判斷某些字跟其他字的語意不同。

（如果哪一天，「、」、《、》等符號也可以直接當成 HTML 標籤來用……那大概會很有趣。啊，我又岔題了。）

[1]: http://mmdays.com/2010/04/23/facebook_deal_with_devil/
[2]: http://microformats.org/

Best,
/Jedi/

Received on Thursday, 26 August 2010 09:52:56 UTC