使用文档转换器发布页面

上次修改时间: 2009年9月21日

适用范围: SharePoint Server 2010

Microsoft SharePoint Server 2010 中的 Web 内容管理功能包括将文档转换为网页的功能,这些网页可发布到指定的位置并根据需要从源文档中进行更新。这使用户能够在自己选择的客户端应用程序中创作文档,充分利用应用程序提供的功能,将文档存储在 SharePoint Server 2010 中,然后让 SharePoint Server 2010 从文档生成发布网页。

转换过程概述

文档到页面转换过程建立在 SharePoint Server 2010 中的文档转换器基础结构之上。您可以通过用户界面或使用 AddUpdateContentFromSourceDocument 方法启动转换。此时,会将要转换的文档以及包含转换器设置的可选 XML 文件传递到 DocConversionLoadBalancerService 服务,此服务转而调用 DocConversionLauncherService 服务。DocConversionLauncherService 服务启动指定的转换器,此转换器使用传递到该转换器的配置设置将文档转换为 HTML。转换器将生成完整格式的 HTML 文档。

最后,文档到页面转换器基础结构执行后续处理以完成以下操作:

  • 将由转换器生成的 HTML 从 <Body> 标记和任何嵌入式 <Styles> 标记的内容中分离开来。

  • 在指定的位置和使用所选的页面布局,创建新网页或更新现有网页。

  • 将 <Body> 和 <Styles> 内容数据放入该网页中的指定字段中

下图显示文档到页面转换过程。

文档到页面的转换过程

发布网页并将转换器生成的 HTML 内容插入到该网页的后续处理步骤与标准文档转换器的标准后续处理过程不同,并且前者取代了后者。

标准文档转换器的后续处理包括将原始文档的元数据复制到转换后的文档,并将转换后的文档直接放入与原始文档相同的文档库中。有关标准文档转换过程的详细信息,请参阅文档转换器

SharePoint Server 2010 包含四个文档到页面转换器:

  • Docx 文件到网页

  • Docm 文件到网页

  • Microsoft Office InfoPath 文件到网页

  • 泛型 XML 文件到网页;通过由用户指定的 XSLT 转换将 XML 文件转换为网页。XSLT 必须能够将 XML 转换为 HTML。

原始文档与已发布网页之间的关系

与标准文档转换不同,在文档到页面转换中,已发布网页和原始文档同时保留表示彼此之间关联的对象模型属性。已发布网页包含一个表示它所基于的原始文档的属性;类似地,原始文档包含一个属性,该属性表示通过此原始文档所生成的上一个已发布网页。

可以使用一个转换器从同一个原始文档发布多个网页。还可以使用多个转换器从同一个原始文档发布网页。您甚至可以从同一个原始文档发布多个页面,并将多个页面发布到同一个文档库中(如果您指定不同的转换设置)。

请注意,仅将指向已创建的最后一个网页的属性与原始文档一起存储。

同步和异步转换

用户可以通过用户界面或以编程方式选择运行文档到页面转换的方式:立即运行,还是将其作为一个异步计时器作业来运行。

请注意,转换速度可能受以下因素影响:

  • 文档转换器启动器服务的数量

  • 转换请求的数量

如果您以异步方式调用转换器,并且某个用户已经使用第一个启动器来转换文件,则调用将被传送到第二个启动器,依次类推,直到找到一个打开的启动器。但是,如果您只有一个启动器或者所有启动器都在使用中,则转换调用将失败。SharePoint Server 2010 通过将转换重新提交为异步作业来处理这种情况。在这种情况下,转换所需的时间可能较长,因为计时器作业启动,找到转换请求,然后继续转换。无论是通过用户界面还是以编程方式启动转换,都会发生此重新提交过程。

请参阅

概念

自定义文档到页面转换器

转换器设置和内容类型

文档转换器概述

文档转换器