你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

自定义翻译器的常见问题解答

本文包含有关自定义翻译的常见问题解答。

自定义翻译目前有哪些限制?

在文件大小、模型训练和模型部署方面没有限制。 设置训练以便在自定义翻译中构建模型时,请记住以下限制。

  • 要翻译的文件大小必须小于 100 MB。
  • 不支持单语数据。 单语文件包含一种语言,该语言不与其他语言的另一个文件配对。

何时应该请求部署已训练的翻译系统?

可能需要经历多次训练才能为项目创建最佳的翻译系统。 如果 BLEU 评分和/或测试结果不令人满意,你可能想尝试使用更多的训练数据或更多精心筛选的数据。 设计优化集和测试集时应该严谨且慎重。 确保你的集全面涵盖了所要翻译的材料的术语和样式。 可以更自由地撰写训练数据,并体验不同的选项。 如果对系统测试结果中的翻译感到满意,并不用添加更多数据来改善已训练的系统,可请求系统部署。

可以在一个项目中部署多少个已训练的系统?

在每个项目中只能部署一个已训练的系统? 可能需要经历多次训练才能为项目创建合适的翻译系统,我们鼓励你请求部署可提供最佳结果的训练。 可以参考 BLEU 评分(越高越好)来确定训练的质量,并在确定翻译质量是否适合部署之前咨询评审者。

训练的部署预期在多长时间内完成?

部署通常需要花费不到一小时的时间。

如何访问已部署的系统?

可以使用 Microsoft 文本翻译 API V3 并指定 CategoryID 来访问已部署的系统。 在 API 参考网页中可以找到有关文本翻译 API 的详细信息。

如果我的数据已进行句子对齐,如何跳过对齐和断句?

对于 TMX 文件和扩展名为 .align 的文本文件,自定义翻译会跳过句子对齐和断句。 对于已完美对齐且无需进一步处理的 .align 文件,用户可以通过某个选项跳过自定义翻译器的断句和对齐处理。 我们建议仅对完美对齐的文件使用 .align 扩展名。

如果提取的句子数与具有相同基本名称的两个文件不匹配,自定义翻译工具会针对 .align 文件运行句子对齐程序。

我尝试上传翻译内存交换 (TMX) 文件,但显示“文档处理失败”

请确保 TMX 符合 TMX 1.4b 规范

后续步骤