本文章包含有关 AI Builder 中的文档处理模型的常见问题。 如果您在这里没有找到您的问题,请查看文档处理 AI 模型概述或将您的问题提交到 AI Builder 的 Power Automate 社区。
功能
使用文档处理可以做什么?
通过文档处理,您可以构建自定义 AI 模型来从各种文档中提取信息。
- 如果您的文档元素可以在相似的地方找到,那么固定模板文档选项是理想的选择。 发票、采购订单、交货单和税单通常都是如此。
- 常规文档选项适用于任何类型的文档,包括第一个选项支持的文档以及合同、工作说明书、信函等。 此选项可以更有效地提取数据,但需要更长的训练时间。
了解更多信息:文档处理模型概述
文档处理可以处理哪些类型的文档?
支持的文件类型为 PDF、JPG 和 PNG。
使用文档处理可以从文档中提取哪些数据?
文档处理可以从文档中提取字段、表和复选框。
了解详细信息:定义要提取的信息
我能否从文档中提取手写文本?
是的。 文档处理可以从您的文档中提取印刷和手写文本。
我需要多少示例来训练文档处理模型?
对于使用相同布局的高质量文档,五个示例文档就足够了。 对于低质量文档(例如,扫描质量较差),可能需要更多示例文档。 要改善结果,请使用 15 到 20 个示例文档。
最佳做法
对于模板文件
- 每个集合一(1)个布局。
- 同一集合中的布局必须相同。
- 每个集合至少五(5)个文档,最多 20 个文档(不超过此限制)。
对于一般文档
为文档类型的所有变体(包括结构化文档和非结构化文档)创建单个模型。
标记与其值相关的字段,以提高提取精度。
例如,使用“supplier_id”作为供应商 ID。 字段名称应与文档的语言相匹配。
每个集合至少五(5)个文档,最多 20 个文档(不超过此限制)。
我的模型目前在 v3.1(GA)中发布,我计划使用 v4.0(GA)重新训练它。 是否需要重新标记我的所有文档?
除非要向集合添加新字段、复选框、表、用于数据提取的签名或新文档,否则无需重新标记所有文档。
我可以从一种文档类型切换到另一种文档类型吗?
是的,在编辑模型时,可以在固定模板文档类型和常规文档类型之间切换。 但是,发票不支持此切换。
单个窗体处理模型能否从具有不同布局或模板的文档中提取信息?
是的。 通过使用集合功能,您可以训练单个窗体处理模型来处理具有不同布局的文档。
了解更多信息:按集合对文档进行分组
文档处理可以处理单个文档中的多个表单吗?
每个窗体需要是一个单独的文件。 例如,如果您有一个包含多个发票的 PDF 文档,应在将其发送到文档处理模型之前为每个发票创建一个单独的文件。
您还可以指定文档处理模型要处理的页面。 这样就可以利用该模型的功能逐页循环,一次处理一个窗体。
了解更多信息:页面范围。
我训练了一个文档处理模型,但是在提取数据时效果并不好。 如何改进此模型?
如果您的模型在训练后返回的结果不佳,请编辑模型并提供更多示例进行训练。 您提供的示例越多,AI 模型就越会学习如何从您的文档中提取数据。
了解更多信息:提高文档处理模型的性能
限制
我可以处理的最大文档数是多少?
每 60 秒钟每个环境最多可以处理 360 个文档。
为什么有些字符会被错误识别?
- 有些字符可能会混淆:0(数字)和 O(字母),1(数字)和 l(字母),4(数字)和 A(字母),等等。
- 可能会发生这样的情况,一些位于其他字符上方或附近的字符被错误识别:垂直线上的 O(字母)变成 0(数字),横线上的 5(数字)变成 $(美元符号),l_(小写字母、下划线)变成 L(大写字母),等等。
- 质量差的文档上的一些字符可能会被错误地识别,或者根本无法识别。
在上述情况下,AI Builder 中没有任何方法可以提高识别率。 我们建议改进源文件的质量和布局,以解决类似问题。
备注
Microsoft 不断改进光学字符识别(OCR)技术来检测字符,因此此类问题的发生频率较低。
可以创建一个有很多集合的模型吗?
每个模型最多可以创建 200 个集合。 然而,训练具有数十个集合的常规文档可能需要几个小时,并且在极少数情况下会超时。如果您的模型有大量的集合,预计需要等待 24 小时才能完成模型训练。
我可以在解决方案中创建模型吗?
目前,不可能在解决方案中创建模型。
我可以在我的文档处理模型中使用合同和信件吗?
可以,使用常规选项,文档处理支持合同和信件等非结构化文档。
比较
文档处理、发票处理、收据处理、身份证件读取器、名片阅读器和文本识别之间有什么区别?
根据您的情况,您可能需要使用或组合特定模型。
当您想要提取图像或 PDF 中存在的所有文本时,请使用文本识别。 例如,以后,您可以在提取的文本中搜索关键字,或者构建一些固定规则来提取某些项目。
如果要从发票、收据、护照、驾照或名片中提取信息,请从相应的预生成模型开始:
您可以立即使用这些预生成模型,而无需创建新模型。 这些模型可以提取其相应文档类型中找到的通用信息。
对于任何其他文档类型,您可以创建自定义文档处理模型来提取您需要的字段和表。 如果您需要预生成模型未提供的其他信息,这也适用。
了解详细信息:自定义文档处理模型
AI Builder 文档处理和 Azure 表单识别器有什么区别?
AI Builder 文档处理在 Azure 表单识别器基础上构建。 这为这两款产品提供了 Microsoft AI 的最新进展。
AI Builder 是 Microsoft Power Platform 的一部分。 这使任何人都可以通过易于使用的界面将 AI 添加到应用和自动化功能中。 您无需成为开发人员或数据科学家。
Azure 窗体识别器面向专业开发人员。 他们可以使用简单的 REST API 向其自定义代码解决方案中添加 AI 功能。
成本选项
AI Builder 文档处理的成本是多少?
您可以通过开始试用来开始免费试用文档处理。 评估后,您需要购买 AI Builder 积分来使用文档处理。 您使用文档处理功能处理的每个页面都会消耗 AI Builder 积分,即使该页面不包含要提取的数据。 AI Builder 积分可以通过 AI Builder 附加产品购买。
详细信息,请参阅 AI Builder 许可。