Microsoft Syntex中的结构化和任意格式文档处理概述

注意

到 2024 年 6 月,如果你设置了 即用即付计费 ,则可以免费试用结构化和自由格式的文档处理和其他选定的 Syntex 服务。 有关信息和限制,请参阅试用Microsoft Syntex并浏览其服务

使用结构化文档处理模型 (布局方法) 自动标识字段和表值。 它最适合结构化或半结构化文档,例如表单和发票。

使用任意格式文档处理模型 (任意多边形选择方法) 自动从非结构化文档和任意格式文档(如字母和合同)中提取信息。

注意

Microsoft 尊重你用于在 Syntex 中训练和处理模型的数据的隐私和所有权。 Microsoft 不会使用或传输组织的任何数据来训练 AI 模型、大语言模型或任何其他模型。 数据安全地保留在组织的租户中。 有关详细信息,请参阅 Microsoft 数据保护和隐私

结构化模型和任意多边形模型简介

Microsoft Syntex使用 Microsoft Power Apps AI Builder 文档处理 (以前称为表单处理) 在 SharePoint 文档库中创建结构化和任意格式的文档处理模型。

可以使用 AI Builder 文档处理来创建结构化或自由格式的文档处理模型,这些模型使用机器学习技术识别和提取结构化或半结构化文档(如表单和发票)以及非结构化或任意格式文档(如合同和信件)中的键值对和表数据。

组织通常从各种来源(如邮件、传真和电子邮件)接收大量发票。 处理这些文档并手动将其输入数据库可能需要相当长的时间。 通过使用 AI 从文档中提取文本、键值对和表,Syntex 可自动执行此过程。

注意

有关如何在组织中使用这些模型的详细信息,请参阅开始 推动采用方案和用例

例如,可以创建一个结构化或任意格式的文档处理模型,用于标识上传到文档库的所有文档。 然后,可以从每个文档中提取并显示对你很重要的特定数据。

显示文档库视图的屏幕截图。

你可以使用示例文件来训练模型,并定义将从表单提取的信息。 文档的布局通过培训你的模型获知。 只需 5 个表单文档即可开始操作。 Syntex 将分析键值对的示例文件,还可以手动识别可能未检测到的文件。 可通过 AI 生成器测试示例文件的模型准确性。

只能在启用它的 SharePoint 文档库中创建结构化或任意格式的文档处理模型。 如果已启用,则可以在文档库中看到 “分类和提取 ”选项。

显示 AI Builder 模型的屏幕截图。

如果需要在文档库上启用它,请与 Microsoft 365 管理员联系。

要求和限制

有关选择此模型时要考虑的要求的信息,请参阅 Microsoft Syntex 中模型的要求和限制