你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
文档智能组合的自定义模型
重要
- 使用文档智能选公共预览版,可以提前使用目前正处于开发状态的功能。
- 在正式发布 (GA) 之前,根据用户反馈,功能、方法和流程可能会发生更改。
- 文档智能客户端库的公共预览版默认使用 REST API 版本 2024-02-29-preview。
- 公共预览版 2024-02-29-preview 目前仅在以下 Azure 区域中可用:
- 美国东部
- 美国西部 2
- “西欧”
此内容适用于:v2.1 | 最新版本:v4.0(预览版)
组合模型。 组合模型的创建方式是采用自定义模型的集合并将其分配到基于你的表单类型构建的单个模型。 提交文档以使用组合模型进行分析时,服务会执行分类,以确定哪个自定义模型能够最好地呈现所提交的文档。
借助组合模型,可以将多个自定义模型分配给使用单个模型 ID 调用的组合模型。 如果训练了多个模型并且要对它们进行分组以分析相似表单类型时,组合模型非常有用。 例如,组合模型可能包含为分析供应、设备和家具采购订单而进行训练的自定义模型。 可以使用组合模型为每次分析和提取确定适当的自定义模型,而不是手动尝试选择适当的模型。
Custom form
和Custom template
模型可以组合成单个组合模型。通过模型组合操作,最多可将 200 个经过训练的自定义模型分配到单个组合模型。 若要使用组合模型来分析文档,文档智能将首先对提交的表单进行分类,选择匹配度最佳的已分配模型,然后返回结果。
对于自定义模板模型,可以使用自定义模板的变体或不同的表单类型来创建组合模型。 当传入的表单属于多个模板中的一个模板时,此操作非常有用。
响应包含一个
docType
属性,用于指示已使用哪个组合模型分析了文档。对于
Custom neural
模型,最佳做法是将单个文档类型的所有不同变体添加到单个训练数据集中,并在自定义神经模型上进行训练。 模型组合最适合提交不同类型的文档进行分析的场景。
随着自定义分类模型的推出,你可以选择在分析前将组合模型或分类模型用作显式步骤。 若要更深入地了解何时使用分类或组合模型,请参阅自定义分类模型。
组合模型的限制
备注
随着自定义神经模型的引入,可组合在一起的模型的兼容性存在几项限制。
组合模型兼容性
自定义模型类型 | 使用 v2.1 和 v2.0 训练的模型 | 自定义模板模型 v3.0 | 自定义神经模型 3.0 | 自定义神经模型 v3.1 |
---|---|---|---|---|
使用版本 2.1 和 v2.0 训练的模型 | 支持 | 受支持 | 不支持 | 不支持 |
自定义模板模型 v3.0 | 支持 | 受支持 | 不支持 | 不支持 |
自定义模板模型 v3.0 | 不支持 | 不支持 | 不支持 | 不支持 |
自定义模板模型 v3.1 | 不支持 | 不支持 | 不支持 | 不支持 |
自定义神经网络模型 v3.0 | 不支持 | 不支持 | 支持 | 支持 |
自定义神经网络模型 v3.1 | 不支持 | 不支持 | 支持 | 支持 |
若要组合使用旧版 API(v2.1 或更低版本)训练的模型,请使用相同的标记数据集通过 v3.0 API 训练模型。 该附加事项确保 v2.1 模型可以与其他模型组合在一起。
继续支持使用 API v2.1 组合的模型,这些模型无需更新。
对于自定义模型,可组合的最大数量为 200 个。
开发选项
文档智能 v4.0:2023-02-29-preview 支持以下工具、应用程序和库:
功能 | 资源 |
---|---|
自定义模型 | • 文档智能工作室 • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
组合的模型 | • 文档智能工作室 • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
文档智能 v3.1:2023-07-31 (GA) 支持以下工具、应用程序和库:
功能 | 资源 |
---|---|
自定义模型 | • 文档智能工作室 • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
组合的模型 | • 文档智能工作室 • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
文档智能 v3.0:2022-08-31 (GA) 支持以下工具、应用程序和库:
功能 | 资源 |
---|---|
自定义模型 | • 文档智能工作室 • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
组合的模型 | • 文档智能工作室 • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
文档智能 v2.1 支持以下资源:
功能 | 资源 |
---|---|
自定义模型 | • 文档智能标记工具 • REST API • 客户端库 SDK • 文档智能 Docker 容器 |
组合的模型 | • 文档智能标记工具 • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
后续步骤
了解如何创建和组合自定义模型:
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈