你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure AI 语言中的新增功能

Azure AI 语言会持续更新。 将此页添加为书签,以随时了解最新的发行说明、功能增强内容和我们的最新文档。

2025年5月

2025-05-15-预览版本发布最新的 API 预览版包括命名实体识别(NER)和 PII 检测的更新:

  • 新的DateOfBirthBankAccountNumberPassportNumberDriversLicenseNumber实体类型支持。
  • 改进了 PhoneNumber 实体类型的 AI 质量。

新代理模板。 Azure AI 语言现在支持以下代理模板:

  • 意向路由:检测用户意向并提供精确的答案,非常适合确定性意向路由,以及人工监督的确切问答。
  • 确切的问题答案:通过确定性方法为高价值预定义问题提供一致、准确的响应。

PII 检测增强功能。 Azure AI 语言引入了用于 PII 检测的新自定义和实体子类型功能:

Azure AI Foundry 中的增强 CLU 和 CQA 功能。 Azure AI Foundry 现在提供增强的功能,支持通过定制对话语言理解(CLU)和对话式问答系统(CQA)AI功能来进行精细调整。

  • CLU 和 CQA 创作工具现已在 Azure AI Foundry 中提供。
  • CLU 提供由大型语言模型(LLM)提供支持的快速部署选项,用于快速部署。
  • CQA 集成了 QnA Maker 评分算法,以提供更准确的响应。
  • CQA 支持精确匹配回答,以实现精准的查询解析。

有关更多更新,请参阅我们最新的 TechCommunity 博客文章

2025 年 4 月

  • 更新和改进了 NER 的模型 GA 版本
  • PII 修订的扩展上下文窗口 – 此服务更新扩展了 PII 修订服务考虑的检测窗口,从而提高质量和准确性。
  • 为自定义模型添加了预测功能,包括对话语言理解(CLU)、自定义命名实体识别(NER)和自定义文本分类,现已在三个新区域提供:Jio 印度中部、英国西部和加拿大东部。
  • 扫描的 PDF PII - 用于 PII 编辑的文档输入现在支持扫描的 PDF,可使用 OCR 在数字和非数字文档中实现 PII 检测和编辑。

2025 年 3 月

  • Azure AI 语言资源现在可以部署到三个新区域:Jio 印度中部、英国西部和加拿大东部,具有以下功能:

    • 语言检测
    • 情绪分析
    • 关键短语提取
    • 命名实体识别 (NER)
    • 个人身份信息(PII)实体识别
    • 实体链接
    • 健康状况文本分析
    • 提取文本摘要
  • 命名实体识别(NER)和文本个人身份信息(PII)实体识别模型的后端基础结构现已使用扩展上下文窗口限制进行更新。

  • 我们的 对话 个人身份信息删除 服务现在由升级的 GA 模型驱动。 此修订的版本增强了信用卡号实体和数字标识实体的质量和准确性。 这些实体包括社会保险号码、驾驶执照号码、政策编号、医疗保险受益者标识符和财务账户号码。

2025 年 2 月

  • 文档和文本抽象摘要现在由微调的 Phi-3.5-mini 提供支持! 有关详细信息,请查看 公告博客
  • Azure AI Foundry 中提供了更多技能:提取关键短语、提取命名实体、分析情绪和检测语言。 更多的技能即将到来。

2025 年 1 月

  • 适用于 Azure AI 语言文本分析的 .NET SDK( Azure.AI.Language.Text 1.0.0-beta.2)现已推出。 此客户端库支持最新的 REST API 版本, 2024-11-012024-11-15-preview支持以下功能:
    • 语言检测
    • 情绪分析
    • 关键短语提取
    • 命名实体识别 (NER)
    • 个人身份信息(PII)实体识别
    • 实体链接
    • 健康状况文本分析
    • 自定义命名实体识别(自定义 NER)
    • 自定义文本分类
    • 提取文本摘要
    • 抽象文本摘要
  • 自定义情绪分析(预览版)、健康领域的自定义文本分析(预览版)和自定义摘要(预览版)于 2025 年 1 月 10 日停用,因为 Azure AI 功能会基于客户需求和反馈进行持续评估。 根据客户的这些预览功能的反馈,Microsoft即将停用此功能,并使用生成 AI 的强大功能来确定新的自定义模型功能优先级,以更好地满足客户的需求。

2024 年 11 月

  • Azure AI 语言正在迁移到 Azure AI Foundry。 AI Foundry 操场现已提供这些技能:提取健康信息、从对话中提取 PII、从文本中提取 PII、汇总文本、汇总对话、呼叫中心汇总。 更多技能如下。
  • 对话语言理解(CLU)的运行时容器可用于本地连接。
  • 我们的文本 PII 编修服务和对话 PII 服务预览 API(版本 2024-11-15-preview)现在都支持使用标签(而不仅仅是编修字符)来屏蔽检测到的敏感实体。 客户可以指定个人数据内容(如姓名和电话号码)(即“John Doe 收到来自 424-878-9192 的呼叫”)是否用涂除字符屏蔽,例如“********收到来自************的呼叫”;或用实体标签屏蔽,例如“PERSON_1 收到来自 PHONENUMBER_1 的呼叫”。有关如何为输出指定涂除策略样式的详细信息,请参阅我们的方法指南
  • 最新 API 版本 2024-11-15-preview 已移除本机文档支持限制,从而允许客户访问 PII 编修和摘要的本机文档支持。 此版本中的关键更新包括:
    • 增加了最大文件大小限制(从 1 MB 增加到 10 MB)。
    • 增强的 PII 修订自定义:客户现在可以指定是只想要经过修订的文档,还是同时需要经过修订的文档和包含检测到的实体的 JSON 文件。
  • 语言检测是一项内置功能,旨在标识文档写入的语言。 它提供与各种语言相对应的语言代码。 此功能不仅包括标准语言,还包括其变体、方言和某些区域或文化语言。 今天宣布了脚本检测功能的正式发布,以及支持 16 种新增语言,总共支持139 种语言
  • 从 API 版本 2023-04-15-preview 开始,命名实体识别服务实体解析已升级为实体元数据。 如果要调用的 API 预览版等于或新于 2023-04-15-preview,请查看“实体元数据”文章以使用解析功能。 该服务现在支持指定要包含在响应中或从响应中排除的实体标记列表的功能。 如果一段文本被归类为多个实体类型,则 overlapPolicy 参数允许客户指定服务如何处理重叠。 该 inferenceOptions 参数使用户能够修改推理过程,例如阻止检测到的实体值规范化并添加到元数据中。 除了这些可选的输入参数外,我们还支持更新的输出结构(包含新的字段标记、类型和元数据),以确保增强的用户自定义和更深入的分析详细了解我们的文档。
  • 文本分析健康(TA4H)是一种专用工具,旨在从非结构化来源中提取和分类关键医疗详细信息。 这些来源包括医生的笔记、出院摘要、临床文档和电子健康记录。 今天,我们在正式版 API 中发布了对快速医疗保健互操作性资源 (FHIR) 结构和临时断言检测的支持。

2024 年 10 月

  • 使用自定义语言服务功能,可以通过 API 将项目部署到 单个区域内 的多个资源。

2024 年 9 月

2024 年 8 月

2024 年 7 月

  • 英语语境中的对话 PII 编修服务现已正式发布。
  • 对话摘要现在支持预览版中添加的 12 种语言, 如下所示
  • 会议或对话章节摘要标题功能支持更短的长度,以重点关注关键主题。
  • 启用对变音符号数据增强的支持,以便为某些自然语言中使用的变音符号变体生成训练数据的不同版本,这些变体对德语和斯拉夫语言特别有用。

2024 年 2 月

  • 从 API 版本开始,根据 ISO 15924 标准扩展了对添加脚本2023-11-15-preview支持。

2024 年 1 月

2023 年 12 月

  • 健康文本分析 新模型 2023-12-01 现已推出。
  • 新关系类型:BodySiteOfExamination
  • 进行了质量提升以支持放射学文档
  • 显著降低延迟
  • 修复了多个 bug:在 NER、实体链接、关系和断言检测方面进行了改进

2023 年 11 月

2023 年 7 月

2023 年 5 月

2023 年 4 月

  • 健康状况自定义文本分析目前处于公共预览状态,它允许构建自定义的人工智能模型,从非结构化文本中提取特定于医疗保健的实体
  • 现在,可以使用 Azure OpenAI 在创作期间自动标记或生成数据。 若要了解详细信息,请参阅下列链接:
  • 语言检测的最新模型版本 (2022-10-01) 现在支持 6 种国际语言和 12 种罗马化印度语系语言。

2023 年 3 月

2023 年 2 月

  • 对话语言理解和业务流程工作流现已在中国主权云的以下区域中提供:
    • 中国东部 2(创作和预测)
    • 中国北部 2(预测)
  • 对话语言理解和编排工作流的新模型评估更新。
  • 运行状况文本分析的新模型版本 (2023-01-01-preview),具有运行状况社会决定因子的新实体类别
  • 用于命名实体识别功能的新模型版本 ('2023-02-01-preview') 提高了准确性,并提供了其他多达 79 种语言的语言支持

2022 年 12 月

2022 年 11 月

2022 年 10 月

2022 年 9 月

2022 年 8 月

2022 年 7 月

  • 用于情绪分析关键短语提取的新 AI 模型基于 z 代码模型,该模型提供:

    • 情绪分析支持以下 11 种语言的性能和质量改进:ardaelfihinlnoplrusvtr
    • 关键短语提取支持以下 20 种语言的性能和质量改进:afbgcahrdanletfielhuidlvnoplroruskslsvtr
  • 语言服务支持的所有 Azure 区域现在都可使用对话 PII。

  • 新版本的语言 API (2022-07-01-preview) 已可用。 提供以下功能:

    • 针对异步任务的自动语言检测
    • 健康状况文本分析的置信度分数目前在关系中返回。

    若要在 REST API 调用中使用此版本,请使用以下 URL:

    <your-language-resource-endpoint>/language/:analyze-text?api-version=2022-07-01-preview
    

2022 年 6 月

2022 年 5 月

  • 用于对话的 PII 检测。

  • 将文本摘要重新命名为文档摘要。

  • 对话摘要正式开启公共预览。

  • 以下功能现已正式发布 (GA):

    • 自定义文本分类
    • 自定义命名实体识别 (NER)
    • 对话语言理解
    • 协调工作流
  • 自定义文本分类、自定义命名实体识别 (NER)、对话语言理解和业务流程工作流包括以下更新:

    • 数据拆分控件。
    • 可取消训练作业。
    • 可命名自定义部署。 最多可创建 10 个部署。
    • 可交换部署。
    • 用于自定义命名实体识别的自动标注(预览版)
    • 企业就绪情况支持
    • 对话语言理解的训练模型
    • 更新了服务限制
    • 支持对语言资源使用免费 (F0) 层
    • 扩展了区域可用性
    • 更新了模型生命周期以添加训练配置版本

2022 年 4 月

2022 年 3 月

2022 年 2 月

  • 文本摘要的最新模型版本的模型改进

  • 模型 2021-10-01 是用于情绪分析和观点挖掘的正式发布版 (GA),具有增强的表情建模功能,在所有受支持的语言中都具有更好的准确度。

  • 问题解答:主动学习 v2 包含更好的聚类分析逻辑,提高了建议的准确度。 当建议被接受或拒绝时,它会考虑用户操作,以避免重复建议,并改进查询建议。

2021 年 12 月

  • 版本 3.1-preview.x REST 终结点和 5.1.0-beta.x 客户端库已停用。 请升级到 API 的正式发行版 (v3.1)。 如果使用客户端库,请使用包版本 5.1.0 或更高版本。 有关详细信息,请参阅迁移指南

2021 年 11 月

后续步骤