你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
此内容适用于:v4.0 (GA)
v3.1 (GA)
v3.0 (GA)
v2.1 (GA)
文档智能服务会不断更新。 将此页添加为书签,以了解最新的发行说明、功能增强和我们的最新文档。
重要
发布 GA API 后,预览版 API 将会停用。 2023-02-28-preview API 版本即将停用。 如果仍在使用预览 API 或关联的 SDK 版本,请更新代码,以最新的 API 版本 2024-11-30 (GA)
为目标。
2025 年 4 月
文档智能 v4.0 容器现已推出! 目前,布局模型是 v4.0 版本唯一受支持的模型。
有关详细信息, 请参阅:
2024 年 12 月
文档智能 v4.0 编程语言 SDK 现已推出正式版 (GA)!
最新的客户端库默认为服务的 2024-11-30 REST API (GA) 版本。
有关详细信息,请参阅下面支持的编程语言的客户端库:
2024 年 11 月
文档智能 REST API v4.0: 2024-11-30 REST API (GA) 现已推出正式版 (GA)! v4.0 REST API 包含以下更改:
-
- Batch API 现在支持所有模型,包括所有读取模型、布局模型、预生成垂直模型和自定义模型。
- Batch API 支持 LIST 函数,允许用户列出过去七天内的批处理作业。
- Batch API 支持 DELETE 函数,可以根据 GDPR 和隐私要求显式删除批处理作业。
- GetAnalyzeBatchResult 支持在响应中使用 resultId,可以通过 LIST 函数列出所有 resultId。
🆕 可搜索 PDF。 预生成读取模型现在支持图像格式(JPEG/JPG、PNG、BMP、TIFF、HEIF)和语言扩展,目的是包括用于 PDF 输出的中文、日语和韩语。
-
- 自定义分类模型支持增量训练。 可以向现有类添加新样本,或通过引用现有分类器来添加新类。
- 默认情况下,使用 v4.0 时,自定义分类模型在分析期间不拆分文档。 需要将“splitMode”属性显式设置为 auto,以便保存较旧的行为。
- 自定义分类模型现在支持将 25,000 页作为新的训练页面限制。
-
- 自定义神经网络模型现在支持签名检测。
- 需要使用较大的标记数据集来训练模型时,自定义神经模型支持较长的付费训练。 每个日历月的前 20 次训练仍然免费。 任何超过 20 的培训操作都属于付费等级。 了解有关计费的详细信息。
-
- 美国银行对帐单模型现在支持检查表提取。
-
- 支持付款人签名提取
-
- 抵押贷款模型现在支持 1003 表、1004 表、1005 表和结算披露表的签名检测。
-
- 收据模型现在支持更多字段,其中包括 ReceiptType、税率、CountryRegion、净额和说明。
-
- 为 1095A、1095C、1099SSA 和 W4 添加了新的预生成税收模型。
-
- 分析响应会在检索操作完成时起存储 24 小时。 对于想要更快地删除响应的方案,请使用删除分析响应 API 删除响应。
v4.0 API 包含来自预览版的累积更新,如下所示:
2024 年 8 月
文档智能 2024-07-31-preview REST API 现已推出。 此预览版 API 引入并更新了多项功能:
公共预览版 2024-07-31-preview 目前仅在以下 Azure 区域中可用。 Azure AI Foundry 门户中的新文档字段提取模型仅适用于美国中北部区域:
美国东部
美国西部 2
“西欧”
美国中北部
-
- 文档智能现在增加了对模型中加入显式自定义分类模型的支持。 详细了解使用新撰写功能的好处。
-
- 自定义分类模型现在也支持就地更新模型。
- 自定义分类模型增加了对模型复制操作的支持,以启用备份和灾难恢复。
- 自定义分类模型现在支持显式指定输入文档中要分类的页数。
-
- 从评估(表单1004)中提取信息。
- 从就业验证(表单 1005)中提取信息。
-
- 从支票中提取付款人、金额、日期和其他相关信息。
-
- 新的预生成模型,用于处理付款存根,以提取工资、工时、扣减、净工资等。
-
- 新的预生成模型,用于提取帐户信息,包括期初和期末余额、银行对帐单的交易详细信息。
-
- 新的统一美国税务模型,可以从 W-2、1098、1099 和 1040 等表单中提取信息。
🆕 可搜索 PDF。 预构建读取模型现在支持PDF 输出,可下载包含提取结果中的嵌入文本的 PDF,因此允许在搜索、内容复制等场景中使用 PDF。
布局模型现在支持改进的数字检测,现在可以将文档中的数字下载为图像文件,以便进一步了解数字。 布局模型还对已扫描文本的 OCR 模型进行改进,目标是针对单个字符、方框文本和密集文本文档进行改进。
-
- 文档智能现在增加了对批处理分析操作的支持,以支持分析一组文档,从而简化开发人员体验并提高效率。
-
- 该最新模型提高了查询字段 AI 提取质量。
2024 年 5 月
文档智能工作室添加了对 Microsoft Entra(以前称为 Azure Active Directory)身份验证的支持。 有关详细信息,请参阅文档智能工作室中的身份验证。
2024 年 2 月
文档智能 2024-07-31-preview REST API 现已推出。 此预览版 API 引入并更新了多项功能:
公共预览版 2024-07-31-preview 目前仅在以下 Azure 区域中可用:
- 美国东部
- 美国西部 2
- “西欧”
布局模型现在支持图形检测和分层文档结构分析(节和子节)。 读取顺序和逻辑角色检测的 AI 质量也得到了改进。
-
- 自定义提取模型现在支持单元格、行和表级别的置信度分数。 详细了解表、行和单元格置信度。
- 自定义提取模型对字段提取做出了 AI 质量改进。
- 自定义模板提取模型现在支持提取重叠字段。 详细了解重叠字段及其用法。
-
- 支持新的区域设置:
区域设置 代码 阿拉伯语 ( ar
)保加利亚语 ( bg
)希腊语 ( el
)希伯来语 ( he
)马其顿语 ( mk
)俄语 ( ru
)塞尔维亚语(西里尔)( sr-cyrl
)乌克兰语 ( uk
)泰语 ( th
)土耳其语 ( tr
)越南语 ( vi
)- 支持新的货币代码:
货币 区域设置 代码 BAM
波斯尼亚可兑换马克 ( ba
)BGN
保加利亚列弗 ( bg
)ILS
以色列新谢克尔 ( il
)MKD
马其顿代纳尔 ( mk
)RUB
俄罗斯卢布 ( ru
)THB
泰国铢 ( th
)TRY
土耳其里拉 ( tr
)UAH
乌克兰格里夫纳 ( ua
)VND
越南盾 ( vn
)- 税务项支持德国 (
de
)、西班牙 (es
)、葡萄牙 (pt
)、加拿大英语en-CA
的扩展。
-
- 扩展字段支持欧盟身份证和驾照。
-
- 从统一住宅贷款申请中提取信息(表单 1003)。
- 从统一承保和传递汇总(表单 1008)中提取信息。
- 从抵押贷款结算披露中提取信息。
-
- 从银行卡中提取信息。
-
- 用于从结婚证中提取信息的新预生成模型。
2023 年12 月
针对 REST API 2023-10-31-preview 的 文档智能客户端库现已可供使用!
2023 年 11 月
文档智能 2023-10-31-preview REST API 现在可用。 此预览版 API 引入并更新了多项功能:
公共预览版 2023-10-31-preview 目前仅在以下 Azure 区域中可用:
- 美国东部
- 美国西部 2
- “西欧”
-
- 手写语言扩展:俄语(
ru
)、阿拉伯语(ar
)、泰国语(th
)。 - 网络安全行政命令合规性。
- 手写语言扩展:俄语(
-
- 支持 Office 和 HTML 文件。
- Markdown 输出支持。
- 改进表格提取、读取顺序以及章节标题检测。
- 从文档智能 2023-10-31-preview 开始,常规文档模型(预生成文档)已被弃用。 今后,若要从文档中提取键值对,请使用
prebuilt-layout
模型并启用可选的查询字符串参数features=keyValuePairs
。
-
- 现在会提取所有价格相关字段的货币。
-
- 针对医疗保险和医疗补助信息的新字段支持。
-
- 新的 1099 税务模型。 支持基本 1099 形式和以下变体:A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB。
-
- 对
KVK
字段的支持。 - 对
BPAY
字段的支持。 - 大量字段优化。
- 对
-
- 支持多语言文档。
- 新的页面拆分选项:自动拆分、始终按页面拆分、不拆分。
-
- 版本中提供了
2023-10-31-preview
。 - 除读取模型外,所有模型都有可用的附加功能。
- 版本中提供了
注意
随着 2022-08-31
API 正式发布(GA)版本,关联的预览版 API 将被弃用。 如果使用 2021-09-30-preview、2022-01-30-preview 或 2022-06-30-preview API 版本,请将应用程序更新为面向 2022-08-31
API 版本。 涉及一些细微更改。有关详细信息,请参阅迁移指南。