技术简报:利用 Altova 工具优化本地化流程
快速的全球化对许多具有前瞻性的公司的文档需求产生了深远的影响。在严格控制预算的同时,需要快速、准确地将内容本地化,以供分发到各种不同的语言。这意味着许多公司必须重新评估其现有的文档技术和工作流程。XML 和 单一来源出版 它通过将内容结构与外观分离,彻底改变了内容管理、文档交换和多语言沟通的方式。
基于XML的文档系统可以通过简化内容转换为多种数据格式和应用类型,从而大大降低成本。然而,为了充分利用XML带来的优势,必须对传统的文档工作流程进行调整。在整个文档工作流程中,会进行一系列检查和平衡,以确保高质量的内容交付。 “单一来源”的概念确保这些流程(例如,转换、编辑等)无需重复或重新处理,而是所有存储在系统中的内容只需进行微小的调整和推广,即可加载到相应的应用程序中,以进行交付。
在全球范围内,当需要同时向多种语言的用户提供文档时,可以通过应用翻译脚本以及渲染脚本,轻松地将归档的 XML 原始文档进行翻译。这些脚本还可以根据不同语言的具体要求,对格式进行本地化调整。此外,通过对内容进行标准化,以适应国际市场,可以显著降低翻译和维护成本。
XML 文档
XML 长期以来受到出版行业的推崇,因为它被视为解决内容生产和分发过程中许多问题的成本效益解决方案。将内容转换为 XML 可以提高内容组织、索引、链接、存储、重用以及分发/展示方面的效率。然而,仅仅将内容转换为 XML 并不能使其发挥全部潜力。XML 及其相关技术需要重新设计工作流程,才能充分展现其巨大的潜力。
为了内容发布商优化工作流程,需要尽量减少重复操作。一旦内容发布,它将被编辑并转换为XML格式,并存储在内容管理架构中的集中式单一来源存储库中。这些XML文件本身将被尽可能精简地定义(添加标签),以最大限度地提高灵活性。这个存储库现在成为所有可发布内容的的核心存储机制。在这个发布环节,这个流程模型展现了其主要优势。将内容存储在单一来源存储库中,可以将内容导出为不同格式并应用于不同的平台,从而实现主要自动化。每次需要将内容发布到不同的媒介时,无需进行额外的转换或编辑。此外,任何出现的问题现在都将立即被识别为流程问题,而不是数据问题。
翻译
传统的翻译记忆数据库试图通过将源文本和译文分割成片段,并将这些片段存储在可搜索的数据库中,从而实现内容模块化,以便重复利用。虽然这些半自动化的系统已被证明可以降低成本,但由于翻译通常是在句子级别进行的,因此内容经常脱离上下文,从而导致意义的丢失。另一方面,XML文档本身就具有模块化特性,不需要像传统翻译记忆系统那样进行大量的解析。此外,XML资源可以轻松地进行编码(例如,添加元数据),并在整个翻译过程中进行跟踪,从而确保其始终与翻译人员通常需要的上下文信息紧密相关。
一种支持XML的单源发布模式旨在实现内容重用,从而帮助组织通过减少甚至消除重复翻译,节省大量时间和金钱。XML技术为出版商提供了将内容资产在概念上进行划分的能力,以便进行翻译,同时又能确保它们与上下文保持紧密联系。对于文档框架,例如技术出版,其中文本经常在许多不同的地方重复出现,这种整合资源的能力可以带来巨大的翻译成本节省。
标准
越来越多的新兴标准旨在帮助实现文档框架的本地化。针对翻译工作流程和文档交换的方案,旨在优化多语言环境下的内容管理架构。这些方案包括:
- 翻译记忆交换格式 (TMX):一种与特定供应商无关的 XML 标准,用于在工具之间以及/或在工具和翻译服务提供商之间交换翻译记忆数据
- 术语库交换标准 (TBX):一种基于 XML 的开放标准,用于交换结构化的术语数据
- 开放词汇交换格式 (OLIF)——一种开放的、符合XML标准的,用于交换术语和词汇数据的格式
- XML 本地化交换文件格式 (XLIFF):一种基于 XML 的词汇表,用于交换可本地化的软件和基于文档的对象,以及相关的元数据。(XLIFF 也被 DITA 翻译分委员会采用。)
- 翻译网络服务 (TransWS) – 规定了使用网络服务来提交和检索与本地化项目相关的文件和消息所需的调用接口
- **基于XML的文本存储 (xml:tm) **——一种开放的XML标准,它允许将文本存储直接嵌入到XML文档中,并使用XML命名空间语法来实现
XML的扩展性使其能够用于创建各种行业标准,其中许多标准能够帮助企业优化业务流程,并改善沟通。
格式设置
在当今全球市场中,许多组织面临着需要以多种不同语言创建内容的挑战。在传统的文档工作流程模式下,这是一个极其繁琐的过程。传统的出版软件,如Quark、PageMaker、FrameMaker等,需要昂贵且耗费大量资源的桌面排版和工程流程来进行内容重用。此外,这些页面布局应用程序通常不适合用于输出多种格式。XML本质上是可扩展的,它提供了无限的方式来定义和组织标记。这种灵活性也使其能够处理任意数据结构,并向人类用户和机器提供信息,以便进行处理。此外,XML还广泛支持Unicode字符,从而可以自动化文本规范化过程,并使其能够原生支持多语言环境。
XML文档框架能够显著提高本地化工作流程的效率。XML固有的内容、结构和外观分离特性,使得企业在翻译文本的同时,能够保持XML Schema或DTD所定义的文档结构。此外,任何额外的格式调整也可以通过应用XSLT和/或XSL:FO样式表在同一时间实现。
Altova 软件:面向全球环境的基于 XML 的统一内容发布解决方案
当然,使用XML技术进行内容国际化有多种不同的方法。以下仅列举了一些例子,展示了如何利用Altova工具来优化全球内容发布的流程。
多种输出格式 StyleVision 是一款图形化的 样式表设计工具,它允许用户创建一份设计方案,并同时将其输出为 HTML、RTF、PDF、Word 2007 (OOXML) 以及 真实的电子表格。
特定语言的样式表 StyleVision 还支持用户自定义参数,这使得设计师可以通过应用变量来保持其 XML 资源的模块化。这使得出版商可以通过导入特定语言的样式表,并在不修改 XML 内容的情况下,轻松地向其文档添加无限数量的新语言。
![]()
当然,这种多语言出版方式可能会导致大量样式表的产生,从而使得维护工作变得越来越困难。Altova的基于XML的文件管理系统SchemaAgent,为在大型出版环境中管理XSLT(以及XML Schema和WSDL)文档之间的关系提供了高级支持。
![]()
XSL lang() 函数 StyleVision 还支持 XSL 的 lang() 函数,该函数根据 XML 文档中的 xml:lang 属性,从 XML 源文档中提取正确的翻译。在这种情况下,翻译可以按照 xml:tm 标准,存储在同一个 XML 实例中,也可以分别存储在针对不同语言的独立目录中。
所见即所得的编辑工具 Authentic 为内容贡献者提供了通过基于 StyleVision 中创建的样式表的电子表单,直接编辑 XML 的机会。Authentic 提供免费许可,因此可以部署给无限数量的用户,而不会增加成本。这使得翻译人员可以直接与 XML 文件进行操作,而无需在后续阶段进行转换以进行发布。
![]()
Authentic 还包含一个多语言拼写检查功能,它参考了内置的18种语言的词典和词汇库,帮助作者和译者确保其作品的准确性。
结论
单源出版需要建立一个集中式的内容存储库,该存储库可以被访问、重用,并应用于各种不同的媒介。这确保了内容在无数次迭代过程中都能保持其完整性。
在一个大型文档本地化项目中,能够适应不同的语言和格式要求,可以带来显著的商业优势。为了面向全球受众维护单一内容源,存在多种不同的方法。通过谨慎且专业的态度来准备和管理内容资源,可以确保多种益处,包括提高质量和一致性、降低翻译成本以及延长翻译投资的回报。此外,支持XML的单一内容源发布模式,便于将文档重新利用,以适应各种不同的格式,从而使最终用户可以通过HTML、RTF、PDF、Word 2007 (OOXML)等多种方式访问内容。将该系统整合到组织内部的文档工作流程中,可以确保呈现准确、一致和标准化的信息。
XSL 转换技术在进行特定格式处理的同时,确保文档的内容和结构保持完整。将内容迁移到基于 XML 的统一内容发布流程需要一定的初期规划和技术投入,但其带来的回报是多方面的。这包括降低翻译和排版成本、缩短产品上市时间,以及在未来能够灵活适应新的语言和数据结构需求。因此,虽然投入相对较小,但其价值是值得的。
了解如何通过单源发布技术优化您的全球文档工作流程 StyleVision 免费试用版. 请注意,StyleVision以及上述其他产品都可以在Altova的软件组合包中获得 MissionKit, 它提供用于分布式发布环境的 XML 和数据管理工具。