使用 Azure 文档智能从表单中提取信息
Azure 文档智能旨在支持复杂的文档和表单处理方案。 虽然还可以使用 Azure 内容理解从表单和文档中提取字段,但 Azure 文档智能提供了一个大型的预生成模型库,从简单的收据到复杂的税务表单。 还可以创建自己的复杂自定义模型。
使用预生成模型
让我们探讨一个使用 Azure 文档智能从窗体中提取数据的示例。
假设一家金融贷款公司每天需要处理数百份抵押贷款申请。 这是标准11页抵押贷款申请表格第一页的一个示例。
Azure 文档智能包括此类型的预生成模型,因此可以轻松构建可查找和提取字段的解决方案,例如:
- 借款人名称
- 地址
- 电话号码
- 社会安全号码
- 出生日期
- 婚姻状况
- 就业状态
- 雇主名称
- 雇主地址
- 收入
- 公民权
- 和更多
创建自定义模型
借助 Azure 文档智能,可以使用要分析的文档的标记示例来训练自定义模型。 标记文档涉及使用 OCR 定义文档的 布局 ,以及标识要提取的文档中的离散 字段 。