你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure AI 文档智能的新增功能

此内容适用于:勾选v4.0 (GA)勾选v3.1 (GA)勾选v3.0 (GA)勾选v2.1 (GA)

文档智能服务会不断更新。 将此页添加为书签,以了解最新的发行说明、功能增强和我们的最新文档。

重要

发布 GA API 后,预览版 API 将会停用。 2023-02-28-preview API 版本即将停用。 如果仍在使用预览 API 或关联的 SDK 版本,请更新代码,以最新的 API 版本 2024-11-30 (GA) 为目标。

2025 年 4 月

文档智能 v4.0 容器现已推出! 目前,布局模型是 v4.0 版本唯一受支持的模型。
有关详细信息, 请参阅:

2024 年 12 月

文档智能 v4.0 编程语言 SDK 现已推出正式版 (GA)!

最新的客户端库默认为服务的 2024-11-30 REST API (GA) 版本。

有关详细信息,请参阅下面支持的编程语言的客户端库:

2024 年 11 月

文档智能 REST API v4.0: 2024-11-30 REST API (GA) 现已推出正式版 (GA)! v4.0 REST API 包含以下更改:

  • 🆕 Batch API

    • Batch API 现在支持所有模型,包括所有读取模型、布局模型、预生成垂直模型和自定义模型。
    • Batch API 支持 LIST 函数,允许用户列出过去七天内的批处理作业。
    • Batch API 支持 DELETE 函数,可以根据 GDPR 和隐私要求显式删除批处理作业。
    • GetAnalyzeBatchResult 支持在响应中使用 resultId,可以通过 LIST 函数列出所有 resultId。
  • 🆕 可搜索 PDF。 预生成读取模型现在支持图像格式(JPEG/JPG、PNG、BMP、TIFF、HEIF)和语言扩展,目的是包括用于 PDF 输出的中文、日语和韩语。

  • 自定义分类模型

    • 自定义分类模型支持增量训练。 可以向现有类添加新样本,或通过引用现有分类器来添加新类。
    • 默认情况下,使用 v4.0 时,自定义分类模型在分析期间不拆分文档。 需要将“splitMode”属性显式设置为 auto,以便保存较旧的行为。
    • 自定义分类模型现在支持将 25,000 页作为新的训练页面限制。
  • 自定义神经网络模型

    • 自定义神经网络模型现在支持签名检测。
    • 需要使用较大的标记数据集来训练模型时,自定义神经模型支持较长的付费训练。 每个日历月的前 20 次训练仍然免费。 任何超过 20 的培训操作都属于付费等级。 了解有关计费的详细信息。
  • 美国银行对帐单模型

    • 美国银行对帐单模型现在支持检查表提取。
  • 支票模型

    • 支持付款人签名提取
  • 抵押贷款文档模型

    • 抵押贷款模型现在支持 1003 表、1004 表、1005 表和结算披露表的签名检测。
  • 收据模型

    • 收据模型现在支持更多字段,其中包括 ReceiptType、税率、CountryRegion、净额和说明。
  • 🆕 美国税务模型

    • 为 1095A、1095C、1099SSA 和 W4 添加了新的预生成税收模型。
  • 删除分析响应

    • 分析响应会在检索操作完成时起存储 24 小时。 对于想要更快地删除响应的方案,请使用删除分析响应 API 删除响应。
  • v4.0 API 包含来自预览版的累积更新,如下所示:

2024 年 8 月

文档智能 2024-07-31-preview REST API 现已推出。 此预览版 API 引入并更新了多项功能:

  • 公共预览版 2024-07-31-preview 目前仅在以下 Azure 区域中可用。 Azure AI Foundry 门户中的新文档字段提取模型仅适用于美国中北部区域:

  • 美国东部

  • 美国西部 2

  • “西欧”

  • 美国中北部

  • 🆕 使用自定义分类器构建模型

  • 自定义分类模型

    • 自定义分类模型现在也支持就地更新模型。
    • 自定义分类模型增加了对模型复制操作的支持,以启用备份和灾难恢复。
    • 自定义分类模型现在支持显式指定输入文档中要分类的页数。
  • 🆕 抵押贷款文档模型

    • 从评估(表单1004)中提取信息。
    • 从就业验证(表单 1005)中提取信息。
  • 🆕 支票模型

    • 从支票中提取付款人、金额、日期和其他相关信息。
  • 🆕 付款存根模型

    • 新的预生成模型,用于处理付款存根,以提取工资、工时、扣减、净工资等。
  • 🆕 银行对帐单模型

    • 新的预生成模型,用于提取帐户信息,包括期初和期末余额、银行对帐单的交易详细信息。
  • 🆕 美国税务模型

    • 新的统一美国税务模型,可以从 W-2、1098、1099 和 1040 等表单中提取信息。
  • 🆕 可搜索 PDF。 预构建读取模型现在支持PDF 输出,可下载包含提取结果中的嵌入文本的 PDF,因此允许在搜索、内容复制等场景中使用 PDF。

  • 布局模型现在支持改进的数字检测,现在可以将文档中的数字下载为图像文件,以便进一步了解数字。 布局模型还对已扫描文本的 OCR 模型进行改进,目标是针对单个字符、方框文本和密集文本文档进行改进。

  • 🆕 Batch API

    • 文档智能现在增加了对批处理分析操作的支持,以支持分析一组文档,从而简化开发人员体验并提高效率。
  • 附加功能

2024 年 5 月

文档智能工作室添加了对 Microsoft Entra(以前称为 Azure Active Directory)身份验证的支持。 有关详细信息,请参阅文档智能工作室中的身份验证

2024 年 2 月

文档智能 2024-07-31-preview REST API 现已推出。 此预览版 API 引入并更新了多项功能:

  • 公共预览版 2024-07-31-preview 目前仅在以下 Azure 区域中可用:

    • 美国东部
    • 美国西部 2
    • “西欧”
  • 布局模型现在支持图形检测分层文档结构分析(节和子节)。 读取顺序和逻辑角色检测的 AI 质量也得到了改进。

  • 自定义提取模型

    • 自定义提取模型现在支持单元格、行和表级别的置信度分数。 详细了解表、行和单元格置信度
    • 自定义提取模型对字段提取做出了 AI 质量改进。
    • 自定义模板提取模型现在支持提取重叠字段。 详细了解重叠字段及其用法
  • 自定义分类模型

    • 自定义分类模型现在支持增量训练,适用于需要通过增加示例或类别来更新分类器模型的场景。 详细了解增量训练
    • 自定义分类模型添加了对 Office 文档类型(.docx、.pptx 和 .xls)的支持。 详细了解扩展文档类型支持
  • 发票模型

    • 支持新的区域设置:
    区域设置 代码
    阿拉伯语 ar
    保加利亚语 bg
    希腊语 el
    希伯来语 he
    马其顿语 mk
    俄语 (ru) 塞尔维亚语(西里尔)(sr-cyrl)
    乌克兰语 uk
    泰语 th
    土耳其语 tr
    越南语 vi
    • 支持新的货币代码:
    货币 区域设置 代码
    BAM 波斯尼亚可兑换马克 ba
    BGN 保加利亚列弗 bg
    ILS 以色列新谢克尔 il
    MKD 马其顿代纳尔 mk
    RUB 俄罗斯卢布 ru
    THB 泰国铢 th
    TRY 土耳其里拉 tr
    UAH 乌克兰格里夫纳 ua
    VND 越南盾 vn
    • 税务项支持德国 (de)、西班牙 (es)、葡萄牙 (pt)、加拿大英语 en-CA 的扩展。
  • ID 模型

  • 🆕 抵押贷款文档

    • 从统一住宅贷款申请中提取信息(表单 1003)。
    • 从统一承保和传递汇总(表单 1008)中提取信息。
    • 从抵押贷款结算披露中提取信息。
  • 🆕 信用卡/借记卡模型

    • 从银行卡中提取信息。
  • 🆕 结婚证

    • 用于从结婚证中提取信息的新预生成模型。

2023 年12 月

针对 REST API 2023-10-31-preview文档智能客户端库现已可供使用!

2023 年 11 月

文档智能 2023-10-31-preview REST API 现在可用。 此预览版 API 引入并更新了多项功能:

  • 公共预览版 2023-10-31-preview 目前仅在以下 Azure 区域中可用:

    • 美国东部
    • 美国西部 2
    • “西欧”
  • 读取模型

    • 手写语言扩展:俄语(ru)、阿拉伯语(ar)、泰国语(th)。
    • 网络安全行政命令合规性。
  • 布局模型

    • 支持 Office 和 HTML 文件。
    • Markdown 输出支持。
    • 改进表格提取、读取顺序以及章节标题检测。
    • 从文档智能 2023-10-31-preview 开始,常规文档模型(预生成文档)已被弃用。 今后,若要从文档中提取键值对,请使用 prebuilt-layout 模型并启用可选的查询字符串参数 features=keyValuePairs
  • 收据模型

    • 现在会提取所有价格相关字段的货币。
  • 医疗保险卡模型

    • 针对医疗保险和医疗补助信息的新字段支持。
  • 美国税务文件模型

    • 新的 1099 税务模型。 支持基本 1099 形式和以下变体:A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB。
  • 发票模型

    • KVK 字段的支持。
    • BPAY 字段的支持。
    • 大量字段优化。
  • 自定义分类

    • 支持多语言文档。
    • 新的页面拆分选项:自动拆分、始终按页面拆分、不拆分。
  • 附加功能

    • 版本中提供了2023-10-31-preview
    • 读取模型外,所有模型都有可用的附加功能。

注意

随着 2022-08-31 API 正式发布(GA)版本,关联的预览版 API 将被弃用。 如果使用 2021-09-30-preview、2022-01-30-preview 或 2022-06-30-preview API 版本,请将应用程序更新为面向 2022-08-31 API 版本。 涉及一些细微更改。有关详细信息,请参阅迁移指南