你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure AI 翻译中有哪些新增功能?
将此页添加为书签,以随时了解最新的发行说明、功能增强内容和我们的最新文档。
翻译器是一种语言服务,它可以帮助用户翻译文本和文档,帮助实体扩大全球经营范围,并帮助保护有可能消失的濒危语言。
翻译器服务支持 100 多种语言的翻译。 如果你的语言社区有兴趣与 Microsoft 合作以将你的语言添加到翻译器,请通过翻译器社区合作伙伴登记表单联系我们。
2024 年 5 月
2024 年 2 月
文档翻译 API 现在支持两种翻译操作:
异步批量文档翻译支持对多个文档和文件进行异步处理。 批量翻译过程需要一个 Azure Blob 存储帐户,其中包含源文档和翻译文档的容器。
同步文档翻译支持同步处理单个文件的翻译。 文件翻译过程不需要 Azure Blob 存储帐户。 最终响应包含翻译后的文档,会直接返回给调用客户端。
2023 年 9 月
- 翻译器服务具有对以下 18 种语言的文本、文档翻译、容器语言支持:
语言 | 代码 | 云 – 文本翻译和文档翻译 | 容器 - 文本翻译 | 说明 |
---|---|---|---|---|
绍纳语 | sn |
✔ | ✔ | 津巴布韦的官方语言,有 800 多万母语使用者。 |
豪撒语 | ha |
✔ | ✔ | 西非使用最广泛的语言,全世界有超过 1.5 亿人使用。 |
伊博语 | ig |
✔ | ✔ | 尼日利亚伊博族的主要母语,使用人数超过 4400 万人。 |
卢旺达语 | rw |
✔ | ✔ | 卢旺达的国语,有 1200 多万人使用,主要分布在非洲东部和中部。 |
林加拉语 | ln |
✔ | ✔ | 刚果民主共和国的四种官方语言之一,有 6000 多万使用者。 |
卢干达语 | lug |
✔ | ✔ | 乌干达的一种主要语言,使用者超过 500 万人。 |
尼昂加语 | nya |
✔ | ✔ | 尼扬贾语,也被称为齐切瓦语,主要在马拉维流行,有 200 多万母语使用者。 |
隆迪语 | run |
✔ | ✔ | 隆迪语,也被称为基隆迪语,是布隆迪的国语,有 600 多万母语使用者。 |
南索托语 | st |
✔ | ✔ | 塞索托语,又称索托语,是莱索托的国家和官方语言,是南非 12 种官方语言之一,也是津巴布韦 16 种官方语言之一。 它有超过 560 万名母语使用者。 |
北索托语 | nso |
✔ | ✔ | 塞索托语,又称北索托语,是南非 460 多万人的母语。 |
茨瓦纳语 | tn |
✔ | ✔ | 塞斯瓦纳语,也被称为茨瓦纳语,是博茨瓦纳和南非的官方语言,有 500 多万使用者。 |
班图语 | xh |
✔ | ✔ | 科萨语是南非和津巴布韦的官方语言,拥有 2000 多万使用者。 |
约鲁巴语 | yo |
✔ | ✔ | 它是西非约鲁巴人的主要母语,拥有 5000 多万使用者。 |
孔卡尼语 | gom |
✔ | ✔ | 印度果阿邦的官方语言,全世界有 700 多万人使用。 |
迈蒂利语 | mai |
✔ | ✔ | 印度 22 种官方承认的语言之一,尼泊尔第二大语言。 它有超过 2000 万使用者。 |
信德语 | sd |
✔ | ✔ | 信德语是巴基斯坦信德省和印度拉贾斯坦邦的官方语言。 它在全球拥有超过 3300 万使用者。 |
僧伽罗语 | si |
✔ | ✔ | 僧伽罗语是斯里兰卡的官方和国家语言之一,有 1600 多万母语使用者。 |
下索布语 | dsb |
✔ | 目前,容器中不支持 | 一种主要在德国东部使用的西斯拉夫语。 它大约有 7000 名使用者。 |
2023 年 7 月
- 文档翻译 REST API v1.1 现已正式推出 (GA)。
2023 年 6 月
文档更新
- 文档翻译 SDK 概述现在可用于为 .NET/C# 和 Python
SDK
提供指导和资源。 - 文档翻译 SDK 快速入门现在适用于 C# 和 Python 编程语言。
2023 年 5 月
宣布推出内部版本 2023 的新版本
文本翻译 SDK(预览版)
文本翻译 SDK
现在提供公共预览版,适用于 C#/.NET、Java、JavaScript/TypeScript 和 Python 编程语言。
- 若要了解详细信息,请参阅文本翻译 SDK 概述。
- 若要开始使用,请尝试使用所选编程语言的文本翻译 SDK 快速入门。
Microsoft 翻译工具 V3 连接器(预览版)
翻译工具 V3 连接器目前提供公共预览版。 该连接器在翻译器服务实例和 Microsoft Power Automate 之间创建连接,让你能够使用一个或多个预构建操作作为应用和工作流中的步骤。 若要了解详细信息,请查看以下文档:
2023 年 2 月
Language Studio 中的文档翻译现已提供公共预览版。 此功能提供无代码用户界面,用于以交互方式翻译本地或 Azure Blob 存储中的文档。
2022 年 11 月
自定义翻译器稳定 GA v2.0 版本
自定义翻译器 v2.0 版本已正式发布,可在生产应用程序中使用!
2022 年 6 月
文档翻译稳定 GA 1.0.0 版本
文档翻译 .NET 和 Python 客户端库 SDK
现已正式发布,可用于生产应用程序!
2022 年 5 月
支持对扫描的 PDF 文档进行文档翻译
- “文档翻译”采用光学字符识别 (OCR) 技术,在保留原始布局的同时提取和翻译 PDF 扫描文档中的文本。
2022 年 4 月
支持翻译法罗语文本和文档
- 翻译器服务支持翻译法罗语(源自法罗群岛的日耳曼语)文本和文档。 法罗群岛是隶属于丹麦王国的一个自治区域,位于挪威和冰岛之间。 法罗语起源于中世纪维京人所讲的古西诺尔斯语。
支持翻译巴斯克语和加利西亚语文本和文档
- 翻译器服务支持翻译巴斯克语和加利西亚语文本和文档。 巴斯克语是一种孤立的语言,也就是说,它不与任何其他现代语言相关,在西班牙北部和法国南部的部分地区使用。 葡萄牙北部和西班牙西部讲述加利西亚语。 巴斯克语和加利西亚语都是西班牙的官方语言。
2022 年 3 月
支持翻译索马里语和祖鲁语文本和文档
- 翻译器服务支持翻译索马里语和祖鲁语文本和文档。 索马里语在整个非洲都有分布,有 2100 多万人使用,属于亚非语系的库希特语分支。 有 1200 万人讲祖鲁语,并且是公认的南非 11 种官方语言之一。
2022 年 2 月
支持翻译上索布语文本和文档
- 翻译器服务支持翻译上索布语文本和文档。 翻译器团队会竭尽所能地保护世界各地的土著语和濒危语言。 上索布语社区提供的语言数据为将这种语言引入翻译器起到了重要作用。
支持翻译因纽纳克坦语和罗马因纽特语文本和文档
- 翻译器服务支持翻译因纽纳克坦语和罗马因纽特语文本和文档。 这两种语言都是土著语,是加拿大文化和社会的重要宝贵遗产。
2022 年 1 月
自定义翻译器门户 (v2.0) 公共预览版
自定义翻译器门户 (v2.0) 现已推出公共预览版,其中包含重大更改,可让你更轻松地创建自定义翻译系统。
有关详细信息,请参阅我们的自定义翻译器文档并尝试按照快速入门中的分步说明进行操作。
2021 年 10 月
支持翻译 100 多种语言的文本和文档
- 翻译器服务新增了对以下语言的文本和文档语言支持:
- 巴什基尔语。 一种大约有 140 万母语使用者使用的突厥语。 它包括三个方言组:南部、东部和西北部。
- 迪维希语。 也称为马尔代夫语,它是一种伊朗语,主要在岛国马尔代夫使用。
- 格鲁吉亚语。 一种卡特维利语,是格鲁吉亚的官方语言。 它大约有 400 万使用者。
- 吉尔吉斯语。 一种突厥语,是吉尔吉斯斯坦的官方语言。
- 马其顿语(西里尔文)。 一种东南斯拉夫语,是北马其顿的官方语言。 该语言大约有 200 万使用者。
- 蒙古语(传统)。 传统蒙古文是专门为蒙古语创建的第一个书写系统。 蒙古语是蒙古国的官方语言。
- 鞑靼语。 一种由现代鞑靼斯坦人使用的突厥语言,与克里米亚鞑靼语和西伯利亚鞑靼语密切相关,但分别属于不同的子群。
- 藏语。 它有近 600 万使用者,在许多藏传佛教出版物中都可以找到。
- 土库曼语。 土库曼斯坦的官方语言。 它类似于土耳其语和阿塞拜疆语。
- 维吾尔语。 一种有近 1500 万使用者的突厥语,主要在中国西部使用。
- 乌兹别克语(拉丁语系)。 一种突厥语,是乌兹别克斯坦的官方语言。 有 3400 万人以该语言为母语。
增加这些语言后,翻译器支持的语言总数达到了 103 种。
2021 年 8 月
支持翻译文言文(中文)文本和文档
- Azure AI 翻译支持翻译文言文(中文)文本和文档。 文言文是中国传统诗人和中国古代诗歌使用的一种传统的书面汉语。
2021 年 6 月
适用于 C#/.NET 和 Python 的文档翻译客户端库 ― 现已推出预发行版
2021 年 5 月
文档翻译 ― 现已推出正式版
- 功能版本:翻译器的异步批量翻译功能现已正式发布。 文档翻译功能旨在翻译包含丰富内容的大型文档和批处理文档,同时保留原始结构和格式。 你还可以使用自定义术语表并利用自定义翻译器构建的自定义模型来确保快速准确地翻译文档。
容器中提供的翻译器服务
- 新版本:容器中的翻译器服务以封闭预览版的形式提供。 请提交在线请求,在获得批准后再开始。 通过容器,你可以在自己的环境中运行数个翻译器服务功能,而且容器非常适合特定的安全性和数据管控要求。 有关详细信息,请参阅安装和运行翻译器容器(预览版)
2021 年 2 月
文档翻译公共预览版
- 新版本:异步批量翻译作为翻译器服务的预览功能提供。 预览功能仍处于开发阶段,不适用于生产。 它们在“预览”的基础上提供,以便客户可以提前访问并提供反馈。 文档翻译可以用于翻译大型文档和处理批处理文件,同时仍然保留原始的结构和格式。 请参阅 Microsoft 翻译工具博客:文档翻译简介
支持翻译 9 种新增语言的文本和文档
翻译器服务支持翻译以下语言的文本和文档:
- 阿尔巴尼亚语。 一种与其他语言无关的孤立语言,有近 800 万人使用。
- 阿姆哈拉语。 埃塞俄比亚的官方语言,大约有 3200 万人使用。 它也是埃塞俄比亚东正教的礼拜语言。
- 亚美尼亚语。 亚美尼亚的官方语言,有 500 万至 700 万人使用。
- 阿塞拜疆语。 一种有大约 2300 万人使用的突厥语。
- 高棉语。 柬埔寨的官方语言,大约有 1600 万人使用。
- 老挝语。 老挝的官方语言,有 3000 万母语使用者。
- 缅甸。 缅甸的官方语言,约有 3300 万人将其作为第一语言使用。
- 尼泊尔语。 尼泊尔的官方语言,大约有 1600 万母语使用者。
- 提格利尼亚语。 厄立特里亚和埃塞俄比亚北部的一种语言,近 1100 万人使用。
2021 年 1 月
支持翻译因纽特语文本和文档
- 翻译器服务支持翻译因纽特语文本和文档,该语言是加拿大的主要因纽特语言之一。 因纽特语是西北地区八种官方土著语言之一。
2020 年 11 月
自定义翻译器 V2 已正式发布
- 新版本:自定义翻译器 V2 升级已完全可用于正式发布 (GA) 的版本。 V2 平台可用于生成包含所有文档类型(训练、测试、优化、短语字典和句子字典)的自定义模型。 请参阅 Microsoft 翻译工具博客:自定义翻译器使翻译质量更接近人类水平。
2020 年 10 月
支持翻译加拿大法语文本和文档
- 翻译器服务支持翻译加拿大法语文本和文档。 加拿大法语和欧洲法语彼此相似,在理解方面是相通的。 但在词汇、语法、书写和发音方面可能存在明显差异。 超过 700 万加拿大人(人口的 20%)将法语作为第一语言使用。
2020 年 9 月
支持翻译阿萨姆语和阿索米亚语文本和文档
- 翻译器服务支持翻译阿萨姆语文本和文档,该语言也称为阿索米亚语。 阿萨姆语/Axomiya 主要在印度东部使用,大约有 1400 万人使用。
2020 年 8 月
介绍用于翻译器的虚拟网络和专用链接
- 新版本: 适用于翻译器的虚拟网络功能和 Azure 专用链接已正式发布 (GA)。 Azure 专用链接支持通过虚拟网络中的专用终结点访问翻译器和 Azure 托管服务。 可以为翻译器使用专用终结点,以便虚拟网络上的客户端能够通过专用链接安全地访问数据。 请参阅Microsoft 翻译工具博客:适用于翻译器的虚拟网络和专用链接现已正式发布
自定义翻译器升级到 v2
- 新版本:自定义翻译 V2 阶段 1 已发布。 最新版本的自定义翻译器分两个阶段推出,旨在加快翻译速度和改进质量,并支持将训练数据保存在所选区域中。 请参阅 Microsoft 翻译工具博客:自定义翻译器:引入更高质量的翻译和区域数据驻留
对两种库尔德方言的文本和文档翻译支持
- 北部的库尔德语 (Kurmanji)(1500 万名母语使用者)和中部的库尔德语 (Sorani)(700 万名母语使用者) 。 大多数库尔德文本都以 Kurmanji 和 Sorani 编写。
支持翻译两种阿富汗语的文本和文档
- 达里语(2000 万名母语使用者)和普什图语(4000 万至6000 万名使用者) 。 阿富汗的两种官方语言。
支持翻译奥里亚语文本和文档
- 奥里亚语是一种传统语言,在印度和世界各地有 3500 万人使用。 它是继孟加拉语、古吉拉特语、印地语、卡纳达语、马拉雅拉姆语、马拉地语、旁遮普语、泰米尔语、泰卢古语、乌尔都语和英语之后,Microsoft 翻译器支持的第 12 种印度常用语言 。