使用 Azure 文档智能从表单中提取信息

已完成

Azure 文档智能旨在支持复杂的文档和表单处理方案。 虽然还可以使用 Azure 内容理解从表单和文档中提取字段,但 Azure 文档智能提供了一个大型的预生成模型库,从简单的收据到复杂的税务表单。 还可以创建自己的复杂自定义模型。

使用预生成模型

让我们探讨一个使用 Azure 文档智能从窗体中提取数据的示例。

假设一家金融贷款公司每天需要处理数百份抵押贷款申请。 这是标准11页抵押贷款申请表格第一页的一个示例。

贷款申请表格的照片。

Azure 文档智能包括此类型的预生成模型,因此可以轻松构建可查找和提取字段的解决方案,例如:

  • 借款人名称
  • 地址
  • 电话号码
  • 社会安全号码
  • 出生日期
  • 婚姻状况
  • 就业状态
  • 雇主名称
  • 雇主地址
  • 收入
  • 公民权
  • 和更多

创建自定义模型

借助 Azure 文档智能,可以使用要分析的文档的标记示例来训练自定义模型。 标记文档涉及使用 OCR 定义文档的 布局 ,以及标识要提取的文档中的离散 字段