W3C home > Mailing lists > Public > public-html-ig-zh@w3.org > October 2010

(wrong string) g

From: John Hax <johnhax@gmail.com>
Date: Wed, 6 Oct 2010 01:32:45 +0800
Message-ID: <AANLkTikXdkk=V_k4jX_w_xdKptHKm1vjKL3zGc_pQCE-@mail.gmail.com>
To: 梁海 <lianghai@gmail.com>
Cc: Ethan Chen <chief@ethantw.net>, Yuan Chao <yuanchao@gmail.com>, (wrong string) ML <public-html-ig-zh@w3.org>
Ethan的看法我很赞同。下面补充些许我的个人看法。

空格是否有语义含义?肯定是*可以有*。但是许多表面上仅为美观的样式,其实背后都隐藏有语义,关键问题是是否值得为此付出成本,或者说收益是否大于成本。

英语也不是生来就用空格的。http://zh.wikipedia.org/zh-cn/File:Sinaiticus_text.jpg
 ——这个是古希腊文所写的西奈抄本,是不用空格的。现代人很难想象拉丁文字也可以连写,但是古人确实如此。这说明空格并没有大家想象得那么重要。

另一个例子是,在进入电脑时代之前,其实有很多种空格,例如用于断词的空格和在句号之后的空格就是不同的。只不过现代数字字体本身可以根据字符组合调整宽度,就无需那么多种不同的空格。但是Unicode规范仍然保留了许多种不同宽度的空格,例如1em、1/2em(en)、1/3em、1/4em、1/5em(thinsp)、1/6em……这些空格只是为排版而存在的,但是它们也可以有语义啊?比如数字千位的分隔在国际单位制的印刷规格中建议用thinsp。可是实际书写时我们只用普通空格。

人们在用笔书写时,在词间、句间或其他位置留多少空白,全是自己做主,最多会有一些书写规范。只是到了印刷时代中,才需要把规范中的空白给固化为不同的空格字符。

不同的空格虽然有语义,但空白的运用不同于其他,很多时候并无强制规则,而只是书写风格而已。而且输入不同的字符是需要成本的,不同的空格虽然有些微语义上的帮助,但是效益并没有那么大,想想古人甚至都完全不用空格!所以从性价比来说,要那么多不同的空格就没有意义,最终就变成现在大家看到的样子,基本上就只用一个空格字符。而那许多样式(和隐藏在样式背后的语义)上的小差异,则由排版软件去自动完成。当然,某些正式场合也可能不是自动完成,而是由专人重新排版的。

回到中文混合外来语的case,若是一定要深究插入空格到底有没有语义上的帮助?我觉得当然总是*可以有*。但是其效益实在太小,麻烦实在太大:
1. 在不追求细节的日常使用中(比如写一写mail),很少有人愿意去额外插空格。
2. 在追求细节的特殊场合(比如出版印刷),单单插入空格又不敷用。
总之就是一个鸡肋。

真正的出路还是在:
A. 排版软件自动调整空白。语义控也可以认为是软件帮助你完善语义。
B. 精确的手工排版。那就不是插一个半角空格,而是要去插1/2em、1/3em、1/4em、thinsp……

2010/10/3 梁海 <lianghai@gmail.com>

> 和您探讨这个“空格”的问题实在让我收获很多,有了不少更加深入的思考。
> 只是因为我几个小时之后就要于凌晨出发去旅行,所以恕我暂时来不及详细阐明我的回应了。
>
> >
> 您反覆強調加入空格符合中、西文的習慣,但事實上,中文從來不使用「半型空格」;且在一篇中文文章裡中文乃屬「主位」、外文為「客位」,客隨主便下中文遇外文不加空格是較為合理的。空格符合「兼容兩種文字的分詞習慣」又是何以見得呢?
>
> 可以说严禁的中文排版中是从来不用半形空格的(此时排除了您上一篇回复的 Yahoo!
>
> 奇摩的截图中出现的这种比较不主流的用空格来断句的情况),中文不“要求(我在九月三十日的邮件中反复强调“要求”)”用空格断词,不过加上空格来断词或断句(比如一些幼儿读物和对外汉语读物)往往会让句子的结构更加明了。但如果取消外文中的空格,带来的是阅读难度大大上升。
> 这是“不要求”与“要求”的区别。
> 所以我们在交界处试图兼容的时候就尽量在一方可以忍受的范围内满足另一方的要求。
>
>
> 当然,您可以说中外文交界处的文字差别已经是足够明显的断词了,那就引出了我前面一直说得不够清楚的问题,那就是外文文本中的空格的节奏感。这像是一种纯粹视觉美感,也是读者在阅读时的潜意识期待,那就是每个词前后都有空格(这样的视觉样式是来源于语义的,来源于断词)。如果在中文中引用的外文词组或断句前后不插入空格,看起来就像您说的一样“有點擠”。
>
>
> > 我希望以<span
> lang="XX">的方式「加上空白」並非為了語意,而是為了美觀(我的意思是,lang="xx"符合語意,但以CSS加上空白則否)。排版軟體提供的漢字、拉丁文間隔我覺得也是為了美觀因素。如果設計師、編輯等認為手加空白才符合語意,當與lang="xx"共用、前後手動加上空白,並取消CSS的前後間隔。
>
>
> 我的思路往往是:理性的美观是最美的。所以我试图思考许多人习惯在中外文之间插入空格的深层原因。我觉得语义(不仅仅是“文字不同”这一语义,还有“断词”的习惯这样的很基本的语义)是根本原因,它影像了人们对文字的感知和决断。
>
> > 再來看下圖(http://cl.ly/2dic),這是我用NeoOffice實驗的漢字、英語(拉丁字母)混用示例(中西文使用相同字體「Hiragino
> Sans GB」)。
> > Content
> > 不難看出辦公軟體所加的間隔也小於一個半型空白,美觀與否我覺得還是比較重要的因素。
>
> 这个,我不得不说不同的软件有不同的习惯,在 InDesign 中,1/4em 是默认设置。不知这里有没有 QuackXpress
> 的用户来给个参考例子。
>
> > 討論了這麼多,我也發現了一些矛盾的地方,不得不舉幾個反例:
> > (略)
> >
> 這就尷尬了!明明是中文、亞洲方塊字語言或大家都看得懂的阿拉伯數字(應該就不用加「lang="ar"」了吧),但卻又同時是拉丁字母。此時該不該加空格、又該怎麼加(尤其是<en>Chinese</en>
> <zh>Kungfu</zh>的地方)才好?現在應該沒有zh-pinyin之類的語言屬性值吧?!或其實可以用LA(Latin)?
>
> 其实在我看来,因为拼音成文的时候也是要求空格断词的,所以其实我以往在写作中也是写成“找到專屬於 ni 的 ta:”这样的。
> 顺便说一下,我以为“傑弗瑞想上道館學<span
> lang="en">Chinese</span>Kungfu(Gongfu)。”这句话写成“傑弗瑞想上道館學<span
> lang="en">Chinese Kungfu</span>(Gongfu)。”为宜。因为“kungfu”(或“kung
>
> fu”)已经是一个英语从汉语借去的词了。日常的汉语语境中我们是不用这个说法的。不过因为我不太清楚台湾的情况(因为台湾对外来文化和外来词汇的吸纳似乎更加自由和包容),所以或许台湾人会对这个词有和我们不一样的认知。
> “非中文的漢字羅馬字”,情况与拼音类似,因为它们成文的时候也是需要空格来断词的。
> 关于“阿拉伯數字”,其实我也一直在想我的做法是不是比较极端,因为我一直也是写成“民國 99 年 10 月 1
>
> 日”这样的,阿拉伯数字中的“,”或“.”也是在进行着和半角空格类似的作用。不过我认为阿拉伯数字并不能说是拉丁字母,我们常见的阿拉伯数字的写法只是拉丁字母文字中的书写习惯而已,它不属于任何一个语言。(顺便提一下,如今在阿拉伯世界和印度都还在用“现代阿拉伯数字”的祖先的后代,比如印度数字是这样的“०१२३४५६७८९”,而阿拉伯文中的数字是“۰۱۲۳۴۵۶۷۸۹”;这么看来,从印度数字开始的这一套数字表示方法拥有在不同文字中不同的书写习惯)。中文中的阿拉伯数字书写习惯与拉丁字母中一致,给中文内部的阿拉伯数字标注其他语言或文字的标签是不妥的。
>
> > 再貼一張圖(http://cl.ly/2e6d
> ),取自Yahoo!奇摩台灣新聞首頁,「推測」這是由報社直接提供的新聞稿,Yahoo!並未再加入其它文字編輯。顯示在台灣,正式文書並沒有於中、西文混排時加入半型空白。
>
> 这张图中仅仅三行就出现了两种对空格的用法,实在难以看出 Yahoo! 奇摩有统一、一贯并且严格的 typography
> 准则,所以我觉得这个参考价值不足。大众媒体的精力有限,难以严格遵守 typography 准则,这是很可以理解的。
> 而如果中文世界也像英文世界一样拥有如此完善而且各领风骚的几个 style
> guide,相信也是一件幸事:http://en.wikipedia.org/wiki/Style_guide
>
> 只希望在各个新标准的制定中能有一贯坚持的明确理念(最好这个理念还是充分吸取了各类主流观点)就好。
>
> 我因为即将启程旅行,不得不暂时退出“空格”的讨论了。
> 为了避免自己在旅途中 geek 精神一再被猛烈唤起然后没法尽情享受旅行,我将暂时把 public-html-ig-zh@w3.org
> 加入“标记为已读后存档”的过滤器中,所以可能暂时关注不了进一步的讨论了。
> 这些天收获颇丰,再次感谢大家。
>
> 梁海
> 北京大学外国语学院印地语二〇〇九级本科
> 印度新德里
> 二〇一〇年十月二日
>
> 在 2010年10月2日 下午6:26,Ethan Chen <chief@ethantw.net>写道:
> >
> > 再貼一張圖(http://cl.ly/2e6d
> ),取自Yahoo!奇摩台灣新聞首頁,「推測」這是由報社直接提供的新聞稿,Yahoo!並未再加入其它文字編輯。顯示在台灣,正式文書並沒有於中、西文混排時加入半型空白。
> >
> >
> > 在 Oct 2, 2010 7:35 PM 時, Ethan Chen 寫到:
> >
> > 所以如果让一个 0.25em的“半型空白”来插入中外文的交界处,它的宽度实际上就不到 0.1em,这实在太小了(甚至比英文排版中最窄的用于 em
> dash 两端的1/8em 的空白还小),这样达不到兼容两种文字的分词习惯的目的。
> >
> > 为了达到尽量优美的排版效果,在中外文的交界处使用尽量兼容两方习惯的排版方式(比如增大间距或插入空格),是非常有逻辑而且效果更优的。
> >
> > 当然不用。因为在英文文本中,英文与引号之间本来就是没有空格的;而中文文本中,中文与引号之间也是没有空格的;于是综合二者的习惯,不用空格。
> >
> >
> 您反覆強調加入空格符合中、西文的習慣,但事實上,中文從來不使用「半型空格」;且在一篇中文文章裡中文乃屬「主位」、外文為「客位」,客隨主便下中文遇外文不加空格是較為合理的。空格符合「兼容兩種文字的分詞習慣」又是何以見得呢?
> >
> > 所以如果让一个 0.25em的“半型空白”来插入中外文的交界处,它的宽度实际上就不到 0.1em,这实在太小了(甚至比英文排版中最窄的用于 em
> dash 两端的1/8em 的空白还小)
> >
> > 我希望以<span
> lang="XX">的方式「加上空白」並非為了語意,而是為了美觀(我的意思是,lang="xx"符合語意,但以CSS加上空白則否)。排版軟體提供的漢字、拉丁文間隔我覺得也是為了美觀因素。如果設計師、編輯等認為手加空白才符合語意,當與lang="xx"共用、前後手動加上空白,並取消CSS的前後間隔。
> > 再來看下圖(http://cl.ly/2dic),這是我用NeoOffice實驗的漢字、英語(拉丁字母)混用示例(中西文使用相同字體「Hiragino
> Sans GB」)。
> > 不難看出辦公軟體所加的間隔也小於一個半型空白,美觀與否我覺得還是比較重要的因素。
> >
> > 討論了這麼多,我也發現了一些矛盾的地方,不得不舉幾個反例:
> >
> > 遇到中文拼音(羅馬字)的時候,如:
> >
> > 找到專屬於ni的ta:
> > 那個MM很火辣;
> > 那個非洲人的HSK(漢語水平考試)成績很好;
> > 我想去參觀台灣T'aipei的Shilin夜市;
> > 傑弗瑞想上道館學<span lang="en">Chinese</span>Kungfu(Gongfu)。
> >
> > 遇到非中文的漢字羅馬字的時候,如:
> >
> > 日本<span lang="ja|en">Tokyo</span>街上的<span lang="ja">sakura</span>真是美呆了;
> > 多吃<span lang="ko">kimchi</span>有益身體健康。
> >
> > 遇到已全球通用的阿拉伯數字的時候
> >
> > 民國99年10月1日;
> > 我剛剛花了美金1,000塊。
> >
> >
> 這就尷尬了!明明是中文、亞洲方塊字語言或大家都看得懂的阿拉伯數字(應該就不用加「lang="ar"」了吧),但卻又同時是拉丁字母。此時該不該加空格、又該怎麼加(尤其是<en>Chinese</en>
> <zh>Kungfu</zh>的地方)才好?現在應該沒有zh-pinyin之類的語言屬性值吧?!或其實可以用LA(Latin)?
> >
> >
> >
> >
>
Received on Tuesday, 5 October 2010 17:33:18 UTC

This archive was generated by hypermail 2.3.1 : Tuesday, 6 January 2015 20:43:46 UTC