你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Document Models - Compose Model

从现有文档模型的文档类型创建新的文档模型。

POST {endpoint}/documentintelligence/documentModels:compose?api-version=2024-07-31-preview

URI 参数

名称 必需 类型 说明
endpoint
path True

string

uri

文档智能服务终结点。

api-version
query True

string

用于此操作的 API 版本。

请求正文

名称 必需 类型 说明
classifierId True

string

用于拆分和分类输入文件的自定义分类器。

docTypes True

<string,  DocumentTypeDetails>

字典映射支持将 docTypes 映射到相应的文档模型。

modelId True

string

唯一的文档模型名称。

description

string

文档模型说明。

split

SplitMode

文件拆分行为。

tags

object

与文档模型关联的键值标记属性的列表。

响应

名称 类型 说明
202 Accepted

已接受请求进行处理,但尚未完成处理。

标头

  • Operation-Location: string
  • Retry-After: integer
Other Status Codes

ErrorResponse

意外的错误响应。

安全性

Ocp-Apim-Subscription-Key

类型: apiKey
在: header

OAuth2Auth

类型: oauth2
流向: accessCode
授权 URL: https://login.microsoftonline.com/common/oauth2/authorize
令牌 URL: https://login.microsoftonline.com/common/oauth2/token

作用域

名称 说明
https://cognitiveservices.azure.com/.default

示例

Compose Document Model

示例请求

POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels:compose?api-version=2024-07-31-preview

{
  "modelId": "composedModel",
  "description": "Composed model description",
  "classifierId": "customClassifier",
  "docTypes": {
    "formA": {
      "modelId": "model1"
    },
    "formB": {
      "modelId": "model2"
    }
  }
}

示例响应

Operation-Location: https://myendpoint.cognitiveservices.azure.com/documentintelligence/operations/b704bb00-d130-4f3f-a1d8-ca96de3eabb4?api-version=2024-07-31-preview

定义

名称 说明
ComposeDocumentModelRequest

请求正文以从组件文档模型创建组合文档模型。

DocumentAnalysisFeature

要启用的文档分析功能。

DocumentBuildMode

自定义文档模型生成模式。

DocumentFieldSchema

使用 JSON 架构样式语法描述字段语义架构。

DocumentFieldType

字段值的语义数据类型。

DocumentTypeDetails

文档类型信息。

Error

错误对象。

ErrorResponse

错误响应对象。

InnerError

包含有关错误的更具体信息的对象。

SplitMode

文件拆分行为。

ComposeDocumentModelRequest

请求正文以从组件文档模型创建组合文档模型。

名称 类型 默认值 说明
classifierId

string

用于拆分和分类输入文件的自定义分类器。

description

string

文档模型说明。

docTypes

<string,  DocumentTypeDetails>

字典映射支持将 docTypes 映射到相应的文档模型。

modelId

string

唯一的文档模型名称。

split

SplitMode

none

文件拆分行为。

tags

object

与文档模型关联的键值标记属性的列表。

DocumentAnalysisFeature

要启用的文档分析功能。

名称 类型 说明
barcodes

string

启用文档中条形码检测。

formulas

string

启用文档中数学表达式的检测。

keyValuePairs

string

启用文档中常规键值对(窗体字段)的检测。

languages

string

启用文本内容语言检测。

ocrHighResolution

string

以更高的分辨率执行 OCR 以处理带有精细打印的文档。

queryFields

string

通过 queryFields 查询参数启用其他字段的提取。

styleFont

string

启用各种字体样式的识别。

DocumentBuildMode

自定义文档模型生成模式。

名称 类型 说明
generative

string

使用生成式 AI 技术启用所有类型的文档。

neural

string

支持具有各种视觉模板的文档。

template

string

使用类似视觉模板的目标文档。

DocumentFieldSchema

使用 JSON 架构样式语法描述字段语义架构。

名称 类型 说明
description

string

字段说明。

example

string

示例字段内容。

items

DocumentFieldSchema

每个数组元素的字段类型架构。

properties

<string,  DocumentFieldSchema>

对象字段的命名子字段。

type

DocumentFieldType

字段值的语义数据类型。

DocumentFieldType

字段值的语义数据类型。

名称 类型 说明
address

string

已分析的地址。

array

string

相同类型的子字段列表。

boolean

string

布尔值,规范化为 true 或 false。

countryRegion

string

国家/地区,规范化为 ISO 3166-1 alpha-3 格式(例如美国)。

currency

string

具有可选货币符号和单位的货币金额。

date

string

日期,规范化为 ISO 8601 (YYYY-MM-DD) 格式。

integer

string

整数,规范化为 64 位有符号整数。

number

string

浮点数,规范化为双精度浮点。

object

string

可能不同类型的子字段的命名列表。

phoneNumber

string

电话号码,规范化为 E.164 (+{CountryCode}{SubscriberNumber}) 格式。

selectionGroup

string

所选字符串值的数组。

selectionMark

string

是否选择了字段?

signature

string

签名是否存在?

string

string

纯文本。

time

string

时间,规范化为 ISO 8601 (hh:mm:ss) 格式。

DocumentTypeDetails

文档类型信息。

名称 类型 说明
buildMode

DocumentBuildMode

自定义文档模型生成模式。

confidenceThreshold

number

仅当 docType 置信度高于阈值时,才执行分析。

description

string

文档模型说明。

features

DocumentAnalysisFeature[]

可选分析功能列表。

fieldConfidence

object

每个字段的估计置信度。

fieldSchema

<string,  DocumentFieldSchema>

使用 JSON 架构样式语法描述文档语义架构。

maxDocumentsToAnalyze

integer

要分析的指定类型的文档的最大数量。 Default=all。

modelId

string

用于分析具有指定类型的文档的文档模型。

queryFields

string[]

要提取的其他字段的列表。 前任。 “NumberOfGuests,StoreNumber”

Error

错误对象。

名称 类型 说明
code

string

服务器定义的错误代码集之一。

details

Error[]

导致此报告错误的特定错误的详细信息数组。

innererror

InnerError

包含与当前对象有关错误的更具体信息的对象。

message

string

错误的人工可读表示形式。

target

string

错误的目标。

ErrorResponse

错误响应对象。

名称 类型 说明
error

Error

错误信息。

InnerError

包含有关错误的更具体信息的对象。

名称 类型 说明
code

string

服务器定义的错误代码集之一。

innererror

InnerError

内部错误。

message

string

错误的人工可读表示形式。

SplitMode

文件拆分行为。

名称 类型 说明
auto

string

自动将文件拆分为文档。

none

string

将整个文件视为单个文档。

perPage

string

将文件中的每一页视为单独的文档。