使用预生成模型从 Microsoft Syntex 中的收据中提取信息

Microsoft Syntex 中的预生成收据模型从销售收据中分析和提取关键信息。 API 识别打印和手写收据,并 提取关键收据信息,例如商家名称、商家电话号码、交易日期、税务和交易总额。 收据可以是各种格式和质量,包括印刷和手写收据。

若要使用收据模型,请执行以下步骤:

步骤 1:创建收据模型

按照 在 Syntex 中创建模型 中的说明创建预生成的收据模型。 然后继续执行以下步骤以完成模型。

步骤 2:上传示例文件进行分析

  1. “模型 ”页上的“ 添加要分析的文件 ”部分中,选择“ 添加文件”。

    “新建模型”页的屏幕截图,其中显示了“添加要分析的文件”部分。

  2. “要分析模型的文件 ”页上,选择“ 添加 ”以查找要使用的文件。

    用于分析模型的文件页的屏幕截图,其中显示了“添加”按钮。

  3. “从训练文件库添加文件 ”页上,选择该文件,然后选择“ 添加”。

    “从训练文件库”页添加文件的屏幕截图。

  4. “要分析模型的文件” 页上,选择“ 下一步”。

步骤 3:为模型选择提取器

在提取程序详细信息页上,你将在右侧看到文档区域和左侧的 “提取程序 ”面板。 “ 提取程序 ”面板显示文档中已标识的提取程序列表。

提取程序详细信息页和提取程序面板的屏幕截图。

在文档区域中以绿色突出显示的实体字段是模型在分析文件时检测到的项。 选择要提取的实体时,突出显示的字段将更改为蓝色。 如果稍后决定不包括实体,突出显示的字段将更改为灰色。 突出显示可更轻松地查看所选提取器的当前状态。

提示

可以使用鼠标上的滚轮或文档区域底部的控件根据需要放大或缩小以读取实体字段。

选择提取程序实体

可以根据自己的偏好,从文档区域或“提取程序”面板中选择 提取程序

  • 若要从文档区域选择提取器,请选择实体字段。

    显示如何选择实体字段的文档区域的屏幕截图。

  • 若要从“ 提取程序 ”面板中选择提取程序,请选中实体名称右侧的复选框。

    显示如何选择实体字段的“提取程序”面板的屏幕截图。

选择提取程序时,文档区域中会显示 “选择提取程序?” 框。 该框显示提取程序名称、原始值,以及将其选择为提取程序的选项。 对于某些数据类型(如数字或日期),它还会显示提取的值。

提取程序详细信息页上“选择提取程序”框的屏幕截图。

原始值是文档中的实际值。 提取的值是将写入 SharePoint 中的列的内容。 将模型应用于库时,可以使用列格式来指定它在文档中的外观。

继续选择要使用的其他提取程序。 还可以添加其他文件以针对此模型配置进行分析。

重命名提取器

可以从模型主页或提取程序面板重命名 提取程序 。 可以考虑重命名选定的提取程序,因为这些名称将在模型应用于库时用作列名称。

若要从模型主页重命名提取程序,请执行以下操作:

  1. 在“ 提取程序 ”部分中,选择要重命名的提取程序,然后选择“ 重命名”。

    “提取程序”部分的屏幕截图,其中突出显示了“重命名”选项。

  2. “重命名实体提取程序 ”面板上,输入提取程序的新名称,然后选择“ 重命名”。

若要从“提取程序”面板重命名 提取程序,请 执行以下操作:

  1. 选择要重命名的提取程序,然后选择“ 重命名”。

    显示如何重命名提取器的“提取程序”面板的屏幕截图。

  2. “重命名提取程序 ”框中,输入提取程序的新名称,然后选择“ 重命名”。

步骤 4:应用模型

  • 若要保存更改并返回到模型主页,请在“ 提取程序 ”面板中选择“ 保存并退出”。

  • 如果已准备好将模型应用于库,请在文档区域中选择“ 下一步”。 在 “添加到库 ”面板上,选择要添加模型的库,然后选择“ 添加”。