- From: Jedi <jedilin@gmail.com>
- Date: Thu, 26 Aug 2010 18:01:29 +0800
- To: public-html-ig-zh@w3.org
前一封信有一段寫錯了, 我是要說「現在主流的搜尋引擎其實很有可能會跳過所有的標點符號,僅針對剩下來的文字做索引」 結果把「搜尋引擎」誤寫成「瀏覽器」,真是抱歉。 Best, /Jedi/ 2010/8/26 Jedi <jedilin@gmail.com>: > 2010/8/26 oldcat <blog.oc@gmail.com>: >>> > 二、如果需要語意,「引號」和《書名號》完全可以處理,對「 >>> > 英國倫敦」這樣的例子來說,搜尋引擎老早就區隔得很準確了; >>> 事實上不是,因為搜尋引擎不會知道這裡的「英國」是不是一個人名、「倫敦」是不是一本書 >> 你的意思是知道是個專有名詞還不夠,要更準確地知道是人名、國名 >> 山川名、河流名、海洋名……我們需要給每一種東西一個個別的語意 >> 標籤? >> >> oc > > 簡短的回答: > > 不是。我們現在只需要區分出著作名稱跟專有名詞的語意。 > > 比較長的回答: > > 我沒有理解錯誤的話,TBL(Tim Berners-Lee)長久以來一直有個夢想叫做語意網(Semantic Web), > 確實是想要精確地知道每個東西個別的語意為何。 > 前些日子 mmdays.com 有一篇在講 facebook 的大陰謀的文章,剛好有很淺白地說明了語意網是怎麼一回事 [1] > > 而實際上 HTML 4.01 的語意標籤仍然不夠,所以才會有微格(Microformats)[2] 這樣的實作嘗試 > 然而實務上過多的標籤並不好用,所以設計標準上就是一堆標籤的競爭與取捨, > 有哪些標籤夠重要,就會留下來;有哪些標籤夠相似,就會被合併。諸如此類。 > > 另一個現實則是,現在主流的瀏覽器其實很有可能會跳過所有的標點符號,僅針對剩下來的文字做索引, > 所以 Google 真的沒辦法從「、」、《、》等符號來判斷某些字跟其他字的語意不同。 > > (如果哪一天,「、」、《、》等符號也可以直接當成 HTML 標籤來用……那大概會很有趣。啊,我又岔題了。) > > [1]: http://mmdays.com/2010/04/23/facebook_deal_with_devil/ > [2]: http://microformats.org/ > > Best, > /Jedi/ >
Received on Thursday, 26 August 2010 10:02:17 UTC