你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure AI 语言会持续更新。 将此页添加为书签,以随时了解最新的发行说明、功能增强内容和我们的最新文档。
2025年5月
2025-05-15-预览版本发布。 最新的 API 预览版包括命名实体识别(NER)和 PII 检测的更新:
- 新的
DateOfBirth
、BankAccountNumber
、PassportNumber
和DriversLicenseNumber
实体类型支持。 - 改进了
PhoneNumber
实体类型的 AI 质量。
新代理模板。 Azure AI 语言现在支持以下代理模板:
PII 检测增强功能。 Azure AI 语言引入了用于 PII 检测的新自定义和实体子类型功能:
- 使用自己的正则表达式自定义 PII 检测(仅限文本 PII 容器)。
- 指定要从 PII 输出中排除的值。
- 使用实体同义词进行定制的 PII 检测。
Azure AI Foundry 中的增强 CLU 和 CQA 功能。 Azure AI Foundry 现在提供增强的功能,支持通过定制对话语言理解(CLU)和对话式问答系统(CQA)AI功能来进行精细调整。
- CLU 和 CQA 创作工具现已在 Azure AI Foundry 中提供。
- CLU 提供由大型语言模型(LLM)提供支持的快速部署选项,用于快速部署。
- CQA 集成了 QnA Maker 评分算法,以提供更准确的响应。
- CQA 支持精确匹配回答,以实现精准的查询解析。
有关更多更新,请参阅我们最新的 TechCommunity 博客文章。
2025 年 4 月
- 更新和改进了 NER 的模型 GA 版本
- PII 修订的扩展上下文窗口 – 此服务更新扩展了 PII 修订服务考虑的检测窗口,从而提高质量和准确性。
- 为自定义模型添加了预测功能,包括对话语言理解(CLU)、自定义命名实体识别(NER)和自定义文本分类,现已在三个新区域提供:Jio 印度中部、英国西部和加拿大东部。
- 扫描的 PDF PII - 用于 PII 编辑的文档输入现在支持扫描的 PDF,可使用
OCR
在数字和非数字文档中实现 PII 检测和编辑。
2025 年 3 月
Azure AI 语言资源现在可以部署到三个新区域:Jio 印度中部、英国西部和加拿大东部,具有以下功能:
- 语言检测
- 情绪分析
- 关键短语提取
- 命名实体识别 (NER)
- 个人身份信息(PII)实体识别
- 实体链接
- 健康状况文本分析
- 提取文本摘要
命名实体识别(NER)和文本个人身份信息(PII)实体识别模型的后端基础结构现已使用扩展上下文窗口限制进行更新。
我们的 对话 个人身份信息删除 服务现在由升级的 GA 模型驱动。 此修订的版本增强了信用卡号实体和数字标识实体的质量和准确性。 这些实体包括社会保险号码、驾驶执照号码、政策编号、医疗保险受益者标识符和财务账户号码。
2025 年 2 月
- 文档和文本抽象摘要现在由微调的 Phi-3.5-mini 提供支持! 有关详细信息,请查看 公告博客 。
- Azure AI Foundry 中提供了更多技能:提取关键短语、提取命名实体、分析情绪和检测语言。 更多的技能即将到来。
2025 年 1 月
- 适用于 Azure AI 语言文本分析的 .NET SDK( Azure.AI.Language.Text 1.0.0-beta.2)现已推出。 此客户端库支持最新的 REST API 版本,
2024-11-01
并2024-11-15-preview
支持以下功能:- 语言检测
- 情绪分析
- 关键短语提取
- 命名实体识别 (NER)
- 个人身份信息(PII)实体识别
- 实体链接
- 健康状况文本分析
- 自定义命名实体识别(自定义 NER)
- 自定义文本分类
- 提取文本摘要
- 抽象文本摘要
- 自定义情绪分析(预览版)、健康领域的自定义文本分析(预览版)和自定义摘要(预览版)于 2025 年 1 月 10 日停用,因为 Azure AI 功能会基于客户需求和反馈进行持续评估。 根据客户的这些预览功能的反馈,Microsoft即将停用此功能,并使用生成 AI 的强大功能来确定新的自定义模型功能优先级,以更好地满足客户的需求。
2024 年 11 月
- Azure AI 语言正在迁移到 Azure AI Foundry。 AI Foundry 操场现已提供这些技能:提取健康信息、从对话中提取 PII、从文本中提取 PII、汇总文本、汇总对话、呼叫中心汇总。 更多技能如下。
- 对话语言理解(CLU)的运行时容器可用于本地连接。
- 我们的文本 PII 编修服务和对话 PII 服务预览 API(版本 2024-11-15-preview)现在都支持使用标签(而不仅仅是编修字符)来屏蔽检测到的敏感实体。 客户可以指定个人数据内容(如姓名和电话号码)(即“John Doe 收到来自 424-878-9192 的呼叫”)是否用涂除字符屏蔽,例如“********收到来自************的呼叫”;或用实体标签屏蔽,例如“
PERSON_1
收到来自PHONENUMBER_1
的呼叫”。有关如何为输出指定涂除策略样式的详细信息,请参阅我们的方法指南。 - 最新 API 版本 2024-11-15-preview 已移除本机文档支持限制,从而允许客户访问 PII 编修和摘要的本机文档支持。 此版本中的关键更新包括:
- 增加了最大文件大小限制(从 1 MB 增加到 10 MB)。
- 增强的 PII 修订自定义:客户现在可以指定是只想要经过修订的文档,还是同时需要经过修订的文档和包含检测到的实体的 JSON 文件。
- 语言检测是一项内置功能,旨在标识文档写入的语言。 它提供与各种语言相对应的语言代码。 此功能不仅包括标准语言,还包括其变体、方言和某些区域或文化语言。 今天宣布了脚本检测功能的正式发布,以及支持 16 种新增语言,总共支持139 种语言。
- 从 API 版本 2023-04-15-preview 开始,命名实体识别服务、实体解析已升级为实体元数据。 如果要调用的 API 预览版等于或新于 2023-04-15-preview,请查看“实体元数据”文章以使用解析功能。 该服务现在支持指定要包含在响应中或从响应中排除的实体标记列表的功能。 如果一段文本被归类为多个实体类型,则 overlapPolicy 参数允许客户指定服务如何处理重叠。 该
inferenceOptions
参数使用户能够修改推理过程,例如阻止检测到的实体值规范化并添加到元数据中。 除了这些可选的输入参数外,我们还支持更新的输出结构(包含新的字段标记、类型和元数据),以确保增强的用户自定义和更深入的分析详细了解我们的文档。 - 文本分析健康(TA4H)是一种专用工具,旨在从非结构化来源中提取和分类关键医疗详细信息。 这些来源包括医生的笔记、出院摘要、临床文档和电子健康记录。 今天,我们在正式版 API 中发布了对快速医疗保健互操作性资源 (FHIR) 结构和临时断言检测的支持。
2024 年 10 月
- 使用自定义语言服务功能,可以通过 API 将项目部署到 单个区域内 的多个资源。
2024 年 9 月
- PII 检测现在提供容器支持。 请参阅 Azure 更新文章中的更多详细信息:宣布发布文本 PII 修订容器。
- 自定义情绪分析(预览版)将于 2025 年 1 月 10 日停用。 可以转换到其他自定义模型训练服务,例如 Azure AI 语言中的自定义文本分类。 请参阅 Azure 更新文章中的更多详细信息:停用:宣布即将停用 Azure AI 语言 (microsoft.com) 中的自定义情绪分析(预览版)。
- 健康领域的自定义文本分析(预览版)将于 2025 年 1 月 10 日停用。 请在该日期前转换到其他自定义模型训练服务,例如 Azure AI 语言中的自定义命名实体识别。 请参阅 Azure 更新文章中的更多详细信息:停用:宣布即将停用 Azure AI 语言 (microsoft.com) 中的自定义健康状况文本分析(预览版)。
2024 年 8 月
- 项目中的 CLU 语句限制从 25,000 提高到 50,000。
- CLU 新版训练配置(版本 2024-08-01-preview)现已推出,提高了域外语句的意向识别质量。
2024 年 7 月
- 英语语境中的对话 PII 编修服务现已正式发布。
- 对话摘要现在支持预览版中添加的 12 种语言, 如下所示。
- 会议或对话章节摘要标题功能支持更短的长度,以重点关注关键主题。
- 启用对变音符号数据增强的支持,以便为某些自然语言中使用的变音符号变体生成训练数据的不同版本,这些变体对德语和斯拉夫语言特别有用。
2024 年 2 月
- 从 API 版本开始,根据 ISO 15924 标准扩展了对添加脚本
2023-11-15-preview
支持。
2024 年 1 月
- 原生文档支持目前在
2023-11-15-preview
公共预览版中可用。
2023 年 12 月
- 健康文本分析 新模型
2023-12-01
现已推出。 - 新关系类型:
BodySiteOfExamination
- 进行了质量提升以支持放射学文档
- 显著降低延迟
- 修复了多个 bug:在 NER、实体链接、关系和断言检测方面进行了改进
2023 年 11 月
- 命名实体识别容器现已正式发布 (GA)。
2023 年 7 月
- 自定义情绪分析现为预览版。
2023 年 5 月
- 自定义命名实体识别 (NER) Docker 容器现在可用于本地部署。
2023 年 4 月
- 健康状况自定义文本分析目前处于公共预览状态,它允许构建自定义的人工智能模型,从非结构化文本中提取特定于医疗保健的实体
- 现在,可以使用 Azure OpenAI 在创作期间自动标记或生成数据。 若要了解详细信息,请参阅下列链接:
- 语言检测的最新模型版本 (
2022-10-01
) 现在支持 6 种国际语言和 12 种罗马化印度语系语言。
2023 年 3 月
用于个人识别信息 (PII) 检测的新模型 (2023-01-01-preview),提供了质量更新和新的语言支持
新版本的文本分析客户端库现提供预览版:
2023 年 2 月
- 对话语言理解和业务流程工作流现已在中国主权云的以下区域中提供:
- 中国东部 2(创作和预测)
- 中国北部 2(预测)
- 对话语言理解和编排工作流的新模型评估更新。
- 运行状况文本分析的新模型版本 (2023-01-01-preview),具有运行状况社会决定因子的新实体类别。
- 用于命名实体识别功能的新模型版本 ('2023-02-01-preview') 提高了准确性,并提供了其他多达 79 种语言的语言支持。
2022 年 12 月
- 文本分析客户端库的新版本 (v5.2.0-beta.1) 以 C#/.NET 预览版提供:
- 发布了用于语言检测的新模型版本 (
2022-10-01
)。 新模型版本改进了短文本的语言检测质量。
2022 年 11 月
扩展了针对以下功能的语言支持:
对话 PII 现在支持最多 40,000 个字符的文档大小。
新版本的文本分析客户端库现提供预览版:
Java
JavaScript
Python
2022 年 10 月
- 摘要功能现在具有以下功能:
- 扩展了以下项的语言支持:
- 用于多区域部署和项目资产版本管理:
- 对话语言理解中的正则表达式和所需组件,增加了影响实体预测的功能。
- 命名实体识别中的实体解析
- 新增以下项的区域支持:
- 将文档类型作为健康状况文本分析 FHIR 请求支持的输入
2022 年 9 月
- 对话语言理解在以下区域中可用:
- 印度中部
- 瑞士北部
- 美国西部 2
- 运行状况文本分析现在支持更多语言(预览版):西班牙语、法语、德语、意大利语、葡萄牙语和希伯来语。 使用 Docker 容器部署 API 服务时,可以使用这些语言。
- Azure.AI.TextAnalytics 客户端库 v5.2.0 已正式发布,可用于生产应用程序。 有关语言服务客户端库的详细信息,请参阅开发人员概述。
- 爪哇岛
- 蟒
- C#/.NET
2022 年 8 月
- 语言服务的基于角色的访问控制。
2022 年 7 月
语言服务支持的所有 Azure 区域现在都可使用对话 PII。
新版本的语言 API (
2022-07-01-preview
) 已可用。 提供以下功能:- 针对异步任务的自动语言检测。
- 健康状况文本分析的置信度分数目前在关系中返回。
若要在 REST API 调用中使用此版本,请使用以下 URL:
<your-language-resource-endpoint>/language/:analyze-text?api-version=2022-07-01-preview
2022 年 6 月
- 用于对话语言理解和业务流程工作流的 v1.0 客户端库现已正式发布,适用于以下语言:
- v1.1.0b1 客户端库的对话摘要预览版现已提供给:
- 有一个新的终结点 URL 和请求格式,用于对预生成的语言服务功能进行 REST API 调用。 有关如何构建 API 调用的信息,请参阅以下快速入门指南和参考文档。 所有文本分析
3.2-preview.2
API 用户都可以开始将其工作负载迁移到这个新终结点。
2022 年 5 月
用于对话的 PII 检测。
将文本摘要重新命名为文档摘要。
对话摘要正式开启公共预览。
以下功能现已正式发布 (GA):
- 自定义文本分类
- 自定义命名实体识别 (NER)
- 对话语言理解
- 协调工作流
自定义文本分类、自定义命名实体识别 (NER)、对话语言理解和业务流程工作流包括以下更新:
- 数据拆分控件。
- 可取消训练作业。
- 可命名自定义部署。 最多可创建 10 个部署。
- 可交换部署。
- 用于自定义命名实体识别的自动标注(预览版)
- 企业就绪情况支持
- 对话语言理解的训练模型
- 更新了服务限制
- 支持对语言资源使用免费 (F0) 层
- 扩展了区域可用性
- 更新了模型生命周期以添加训练配置版本
2022 年 4 月
- 快速医疗保健互操作性资源 (FHIR) 支持在运行状况文本分析的语言 REST API 预览版中可用。
2022 年 3 月
- 扩展了以下项的语言支持:
2022 年 2 月
文本摘要的最新模型版本的模型改进
模型
2021-10-01
是用于情绪分析和观点挖掘的正式发布版 (GA),具有增强的表情建模功能,在所有受支持的语言中都具有更好的准确度。问题解答:主动学习 v2 包含更好的聚类分析逻辑,提高了建议的准确度。 当建议被接受或拒绝时,它会考虑用户操作,以避免重复建议,并改进查询建议。
2021 年 12 月
- 版本 3.1-preview.x REST 终结点和 5.1.0-beta.x 客户端库已停用。 请升级到 API 的正式发行版 (v3.1)。 如果使用客户端库,请使用包版本 5.1.0 或更高版本。 有关详细信息,请参阅迁移指南。
2021 年 11 月
根据持续的客户反馈,我们已将健康状况文本分析的每个文档的字符限制从 5,120 提高到 30,720。
Azure AI 语言版本,支持:
用于发送请求到自定义模型的 SDK 支持。
- 自定义命名实体识别
- 自定义文本分类
- 自定义语言理解
后续步骤
- 有关此处未列出的服务更新,请参阅以前的更新文章。