你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是自定义翻译?

自定义翻译是 Microsoft Translator 服务的一项功能,允许翻译企业、应用开发人员和语言服务提供者生成自定义的神经机器翻译 (NMT) 系统。 自定义的翻译系统可无缝集成到现有的应用程序、工作流和网站中。

使用自定义翻译工具生成的翻译系统可以通过同一个基于云、安全、高性能且高度可缩放的 Microsoft 翻译工具文本 API V3 来使用,该 API 版本每天为数十亿条翻译提供支持。

该平台使用户能够生成并发布自定义英语翻译系统。 自定义翻译工具支持三十多种语言,这些语言可以直接映射到适用于 NMT 的语言。 有关完整列表,请参阅翻译工具语言支持

本文档包含以下文章类型:

  • 快速入门介绍了入门说明,指导您完成向服务发出请求。
  • 操作指南包含以更具体的方式或自定义方式使用功能的说明。

功能

自定义翻译工具提供不同的功能,用于生成自定义翻译系统,稍后即可对其进行访问。

功能 说明
应用神经机器翻译技术 应用自定义翻译工具提供的神经机器翻译 (NMT) 来改进翻译。
生成了解业务术语的系统 使用并行文档自定义并生成翻译系统,该系统了解在你自己的业务和行业中使用的术语。
使用字典来生成模型 如果没有训练数据集,可以只使用字典数据训练一个模型。
与他人协作 将工作与他人共享,与团队协作。
访问自定义翻译模型 可以通过 Microsoft 文本翻译 API V3 使用现有的应用程序/程序来随时访问自定义翻译模型。

获取更好的翻译

Microsoft Translator 在 2016 年发布了神经机器翻译 (NMT)。 NMT 的翻译质量相对于行业标准的统计机器翻译 (SMT) 技术有很大的进步。 由于 NMT 在翻译之前能够更好地理解完整句子的上下文,因此其提供的翻译质量更高、更类似于人类且更流畅。 自定义翻译为自定义模型提供 NMT,因此翻译质量更好。

可以使用以前翻译的文档生成一个翻译系统。 这些文档包括特定于领域的术语和样式,比标准翻译系统更好。 用户可以上传 ALIGN、PDF、LCL、HTML、HTM、XLF、TMX、XLIFF、TXT、DOCX 和 XLSX 文档。

自定义翻译也接受在文档级别并行的数据,使数据收集和准备更有效。 如果用户可以访问相同内容的多种语言版(但每种语言的内容都位于单独的文档中),自定义翻译将能够跨文档自动匹配句子。

如果提供的训练数据类型和数量适当,则在使用自定义翻译时,常常可以看到获得的 BLEU 分数在 5 到 10 分之间。

提高工作效率和成本效益

使用自定义翻译时,训练和部署自定义系统不需任何编程技能。

使用安全的自定义翻译门户时,用户可以通过一个直观的用户界面来上传训练数据、训练系统和测试系统,并将其部署到生产环境。 然后,系统会在数小时内(实际时间取决于训练数据大小)可供大规模使用。

自定义翻译也可通过专用 API(目前为预览版)以编程方式进行访问。 通过该 API,用户可以通过自己的应用或 Web 服务对训练的创建或更新进行管理。

使用自定义模型来翻译内容时,其价格取决于用户的文本翻译 API 定价层。 如需定价层详细信息,请参阅认知服务文本翻译 API 定价网页

随时随地在所有应用和服务上进行安全的翻译

可以在任何设备上使用标准的 REST 技术通过 Microsoft 文本翻译 API 以无缝方式访问自定义系统,并将其集成到任意产品或业务工作流。

后续步骤