Re: 回复:[求审阅]中文排版规范初稿

杨老师,您好!

非常感谢您和方正的建议,以下是来自我个人在参与这份文档编写工作的一些体会,也许能回答部分的问题。

1. 关于本文档和HTML内容呈现之间的关系。非常抱歉我们之前的标题存在误导性,现已改为《W3C中文版式需求》。您所谈到的在HTML、CSS、阅读器呈现等技术基础上提供如何支持中文版式的规范文档,是我们的下一步计划。现有的文档只是第一步,目标是希望W3C在制定HTML、CSS等技术标准时,能有一份阐述中文版式需求等英文文档作为参考,使HTML、CSS、Web Application等技术在发展时候能考虑实现对中文的支持,使中文用户得到更好的Web使用体验。这方面的考量并不局限于数字出版,而是更广大的Web用户。至于《W3C 数字出版中文规范》,如果大家(尤其在此领域经验非常丰富的方正公司)愿意提供支持,对广大用户和出版界是另一大幸事,我们可以马上启动此文档的编写;

2. 至于简繁中文比例问题,我们第一版草稿的主要编辑是来自繁体使用区域的志愿者,但他们同时也对简体中文有着使用基础和了解,故很多简体方面的规则是以繁体文字阐述。并且在本文档编写的每个阶段,W3C也多次征求主要国内数字出版商和开发者的意见,得到肯定答复。在第一版草稿发布后,也陆续有使用简体的专业人士志愿参加我们的文档编写工作。

非常赞同您所提到的,这份文档需要有来自简体数字出版商的专业知识的输入。我们现在只是处于第一版工作草稿阶段,按计划,我们将在今年第四季度发布正式需求文档,即还有长达6个月的时间。如果简体数字出版商,尤其是在这方面有深厚文化积累的北大方正,愿意参与或提供更具体的改进意见,我相信此文档一定能实现您所建议的、也是我们大家期待的简繁平衡。

3. 此文档只是处于第一版工作草稿阶段,非常感谢几位编辑志愿者的努力。由于各种限制,这份文档不可避免地存在各种不足之处,在草稿发布的第一周时间内,我们就收到近20条非常有意义的修改建议(已在现版本草稿修正)。非常期待大家继续提供各自的见解,让这份文档更准确、更完整地反映中文对Web的需求。

谢谢。

—
xiaoqian

On 2015年4月9日, at 上午6:40, yangleiming(杨雷鸣) <yang_leiming@FOUNDER.COM.CN> wrote:

> 方正对于W3C中文版式规范初稿的回复意见如下,由于新闻出版总署就此草稿征求了方正的意见,此意见也发送给了新闻出版总署刘勇处长。
>  
> ――――――――――――――――――――――――――――――――――――――――――――――――――――
>  
> 1 W3C的数字内容通过Html进行描述和传播,以浏览器(阅读器)对Html数据进行解释和呈现。除此之外,人或者软件在Html的表达范围内,创建更加优秀的Html内容。这三者是呈现一个优秀的数字出版物的基础。
>  
> 2 第三项是一种内容书写的规范,它本身并不能影响Html的描述能力和阅读器的呈现规则,主要是通过培训教育创作来完成,这一项不是我们考虑的重点。Html的描述和阅读器的呈现是密切相关的,可以说,这两者决定了W3C对版式进行呈现所能够达到的能力和效果。
>  
> 3 基于以上阐述,我们在制定W3C的版式描述规范的时候,就不能脱离Html的描述能力和阅读器呈现算法去单独制定版式规范。因为Html只是描述了内容的含义以及大致的呈现效果,而且目前所描述的内容还不能完全表达在印刷时代所呈现的效果。在我们定义了完整的内容描述之后,还需要定义一个内容的精确呈现效果,让阅读器去实现这个精确的呈现效果,才可能得到版式丰富的、排版精确的出版物版式。 Html与PDF的描述方式存在本质的差异,前者描述(结构化)内容忽略精确定位,后者描述精确定位而忽略内容的结构化。
>  
> 4 因此对W3C出版物版式的描述必须以Html的描述为基础。首先给出Html的描述,再给出这种描述在阅读器上进行呈现的精确效果。否则脱离于Html的版式规范就成了无源之水。这里存在一个问题,究竟是先有版式描述还是先有数据描述?我们认为在Html本身的数据描述不够完整的情况下,如果我们先启动版式描述,那么我们必须给出支撑这种版式的数据描述的建议性描述。未来将这种建议性描述做为一种正式描述纳入到Html或者ePub的描述标准中。这样版式描述才有意义。
>  
> 5 对阅读器呈现的描述是一个更大的问题。排版引擎存在非常复杂的细节算法,而且效果受制于环境的影响。对Html的呈现有些类似于微软的Word对Docx(OOXML)的呈现,Html和OOXML都不对内容的位置进行精确描述,而是将这一任务交给了阅读器和编辑器(Word)。我们知道不同版本的Word打开同一个Docx文件效果会有差异,甚至一台机器在不同的时间打开同一个Docx文件也存在差异,那么未来不同的阅读器厂商如何保证对同一个HTML文档进行呈现的一致性呢? 更为要命的是:书籍这样的长文档,排版效果可能产生累计偏差,这种累积偏差可能导致图片、表格这样的大对象落在不同的页上,从而导致版式效果的突变,不符合预期。
>  
> 6 基于以上阐述:由于Html本身是一种标记语言,强调语言的结构化、简洁和可读性。因此寄希望于用HTML和阅读器配合完成数字出版物的精确描述是非常困难的,甚至是难以完成的。我们的重点应该立足于扩充更多的Html及ePub标签,便于使用这些标签去方便的描述更加丰富的出版物版式。即便如此,Html也只能描述非创意性的、简单图文为主的数字出版物;要描述复杂的,具有创意设计效果的出版物版式,Html存在先天的劣势。必须以牺牲结构化和简洁性、可读性为代价。
>  
> 7 本标准初稿在术语描述及版式特点描述上,具有很强的繁体中文色彩,其中明显倾向于描述在繁体中用到而在简体中不常用的版式规范。做为通用的W3C“中文”版式描述规范,应该采用更为中立的描述。
>  
>                                                                                                                                                                                                             
>                                                                                                                                                                                  北京北大方正电子有限公司    
>  
>  
>  
> ----- 原始邮件 -----
> 发件人:Xiaoqian Wu <xiaoqian@w3.org>
> 收件人:中文HTML5同樂會ML <public-html-ig-zh@w3.org>, "public-zhreq@w3.org"<public-zhreq@w3.org>
> 主题:[求审阅]中文排版规范初稿
> 日期:2015年03月31日 00点01分
> 
> 大家好,
> 
> 非常感谢董福興、陳奕鈞和梁海在过去的一年时间里,以志愿协作的方式完成了《中文排版规范》的初稿[1]。
> 
> 本规范旨在总结中文语言里的需求,为CSS、HTML、dPub等规范提供实现支持中文正确显示的依据,也祈求能帮助实现文化的传 承。由于时 间和个人阅历等限制,这份初稿可能还没有涵盖中文各方面的细节需求。欢迎大家审阅本稿,集思广益,通过本邮件列表或者GitHub[2]提供 对相关知识点的见解。
> 
> 你的每点建议,都能帮助CSS、HTML甚至Web更好地支持中文 :-)
> 
> [1]http://www.w3.org/International/docs/chinese-layout/zh/

> [2] https://github.com/w3c/clreq

> 
> --
> xiaoqian
>  

Received on Thursday, 9 April 2015 07:50:58 UTC