提高文档处理模型的性能
如果您的模型性能不是您想要的,例如,您获得的结果不佳或置信度分数较低,您可以尝试以下一些方法。
解释模型准确度分数
解释您的准确度分数,以确定您的模型正在努力提取的内容。 模型评估包括提高分数的建议。
登录到 Power Apps 或 Power Automate。
在左侧窗格中,选择 ... 更多>AI 中心。
在发现 AI 能力下,选择 AI 模型。
(可选)要将 AI 模型永久保留在菜单上以便于访问,请选择大头针图标。
打开您想要研究的文档处理模型。 您应该会看到准确度分数。
备注
在以下情况下,您不会看到文档处理模型的准确度分数:
- 如果模型是在选择“普通文档”作为文档类型时进行的训练。 目前,仅返回“固定模板文档”类型的模型的准确度分数。
- 您的模型已从另一个环境导入。
- 如果您的模型在 2022 年 1 月 1 日之前接受过训练。 在这种情况下,您可以重新训练它。
在模型详细信息页面上,您应该会看到总体准确度分数。
要获取详细信息,选择查看完整评估。
在此面板中,您可以在不同的选项卡之间导航,来确定您的模型正在努力提取的内容。 您可以浏览集合、字段、表和复选框选项卡来查找未正确处理的内容。
以下是字段选项卡中信息的示例。
在此示例中,您需要提高供应商信息的准确性。
将鼠标悬停在准确度分数差的项目上查看如何改进模型的建议。 例如,您可能会看到提供更多示例文档进行训练的建议。
常见问题
如果我的字段、表或复选框的准确度分数较差,我该怎么办?
- 请检查所有文档中的字段、表或复选框是否已正确标记。
- 在存在字段、表或复选框的位置提供更多示例文档进行培训。
如果集合的准确度分数较差,我该怎么办?
检查集合中的文档是否都具有相同的布局。 要了解有关集合的详细信息,请转到按集合分组文档。
向训练数据添加更多文档
您标记的文档越多,AI Builder 就会更多地学习到如何更好地识别这些字段。 要添加更多文档,请编辑您的文档处理模型并上载更多文档。 您将在模型的详细信息页面上找到编辑模型的选项。
更多提示
- 对于已填充的表格,使用已填充所有字段的示例。
- 在每个字段中使用具有不同值的表格。
- 如果窗体图像质量较低,请使用较大的数据集(例如,10-15 个图像)。
- 如果可能,请使用基于文本的 PDF 文档,而不是基于图像的文档。 扫描的 PDF 将作为图像被处理。
- 当您创建文档处理模型时,请上传具有相同布局的文档,其中每个文档都是单独的实例。 例如,不同月份的发票应在单独的文件中,而不应全部在同一文件中。
- 上载示例供训练时,具有不同布局的文档应放入不同集合。
- 如果文档处理模型从您希望模型提取的字段的相邻字段提取值,请编辑模型,将被错误提取的相邻值标记为不同字段。 通过这种方法,模型将会更好地学习每个字段的边界。