- From: John Hax <johnhax@gmail.com>
- Date: Thu, 26 Aug 2010 03:53:28 +0800
- To: Jedi <jedilin@gmail.com>
- Cc: public-html-ig-zh@w3.org
- Message-ID: <AANLkTinmvHOHkcyrj6WXP=k1EtJwhn3CR0GP5hyx3tV6@mail.gmail.com>
那我还是不明白举这个例子的意思。 不过岔题倒是很有意思。 既然现在的汉语标点符号乃是照西文符号抄出来的,为啥当年先贤偏要抄成这样,呵呵。 在西文中其实也有几个符号组成一个符号的。譬如省略号,英文用...(三个句号),但也有真的省略号(…),而中文的省略号是两个…,却没有对应的六点省略号。。。难道是Unicode组织歧视CJK么? 我个人觉得,大概是尊重历史习惯。中文有方块字的习惯,故虽是一个标点,却硬拆分为两字。很可能自活字印刷始,这类标点就是拿两个活字拼成的(请熟悉印刷史的同志指正)。 这类习惯还反映在中文字体上。王越(中文latex社区的活跃分子)曾批评中文字体不用opentype所提供的kern功能来做好标点美化,却要发明标点压缩等特殊规则让排版软件承担责任。我本有同感。后来读了jlreq那个文档,认识到这些特殊规则乃是东亚文字的历史形成,所以排版或阅读软件(以及CSS)要支持这些规则才是真正尊重这些文化传统的做法。 2010/8/26 Jedi <jedilin@gmail.com> > 正好相反,並不會不妥,因為那個例子是刻意舉出來的。 > > 我先前的信中有提到考慮到「出版作業工作鏈」的現實, > 上稿系統、編輯系統、輸入法環境等,都會對產出網頁內容有影響, > 所以我乃是舉出一個實際上會發生的例子來說明。 > > (另外再來岔題一下,沒有人覺得破折號與刪節號明明照規定就是要那麼長 > 為什麼中文輸入的時候卻必須分別輸入兩個字符嗎?) > > Best, > /Jedi/ > > 2010/8/26 John Hax <johnhax@gmail.com>: > > 绝地举的例子不妥。中文破折号其实就是两个mdash(U+2014)。而绝地之前写的那个符号并非破折号而是图形绘制符号(U+2500),属字符误用。 > > > > mdash的直排形式乃是U+FE31。横排的em > dash如何转为此直排形式,即是我之前一封邮件所说的三种方式。实则均是Unicode字符中的字形转换。 > > > > > > 2010/8/25 Jedi <jedilin@gmail.com> > >> > >> 回到 public-html-ig-zh 應該處理的觀點, > >> 我們要討論的應該是老貓提出來的@一點: > >> > >> > html 標準要不要規定 > >> (或者其實還是應該在 CSS 裡面規定) > >> @樣的「轉換」是否應該納入「標準」? > >> > >> 因為就算是用任何 script 來轉,都是多一道轉的手續,而不是原本的內容, > >> 表示你沒辦法在 user agent 不支援 script 的情況下, > >> 直接讓一段內容可以輕鬆寫意地在直排與橫排之間轉換。 > >> > >> > >> 實作上或許可以有些有趣的不同作法, > >> 例如我的內文就不要使用那些標點符號了,而是使用語意標記跟 html entities, > >> 像是原本是: > >> > >> 「中文──真正好」 > >> > >> 我就寫成: > >> > >> <q>中文—真正好</q> > >> > >> 以目前的瀏覽器支援來說,要轉直大概會更好處理。 > >> (當然,@樣的作法是不是好事,可能也還要再討論;我只是突然想到而已) > >> > >> Best, > >> /Jedi/ > >> > >> 2010/8/25 Ben Luo <benluo@gmail.com>: > >> > 2010/8/25 oldcat <blog.oc@gmail.com>: > >> > > >> >> 寫稿大部分使用橫排符號,我們如果要排直排,就要轉換為 > >> >> 直排符號。 > >> >> > >> > 不知道收作者的文件用的什么格式,从直观上看,awk, grep, python, perl之类的应该可以很快写一个script, > >> > 不需要人工来作。 > >> > > > > > >
Received on Wednesday, 25 August 2010 19:53:56 UTC