你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

Document Models - Analyze Document From Stream

参考

服务:: Azure AI Services

API 版本:: 2024-07-31-preview

使用文档模型分析文档。

POST {endpoint}/documentintelligence/documentModels/{modelId}:analyze?api-version=2024-07-31-preview

具有可选参数:

POST {endpoint}/documentintelligence/documentModels/{modelId}:analyze?api-version=2024-07-31-preview&pages={pages}&locale={locale}&stringIndexType={stringIndexType}&features={features}&queryFields={queryFields}&outputContentFormat={outputContentFormat}&output={output}

URI 参数

名称	在	必需	类型	说明
endpoint	path	True	string uri	文档智能服务终结点。
modelId	path	True	string	唯一的文档模型名称。正则表达式模式: `^[a-zA-Z0-9][a-zA-Z0-9._~-]{1,63}$`
api-version	query	True	string	用于此操作的 API 版本。
features	query		DocumentAnalysisFeature[]	可选分析功能列表。
locale	query		string	文本识别和文档分析的区域设置提示。值只能包含语言代码（例如“en”、“fr”）或 BCP 47 语言标记（例如“en-US”）。
output	query		AnalyzeOutputOption[]	在分析期间要生成的其他输出。
outputContentFormat	query		ContentFormat	分析结果顶级内容的格式。
pages	query		string	要分析的基于 1 的页码的列表。前任。 "1-3,5,7-9" 正则表达式模式: `^(\d+(-\d+)?)(,\s(\d+(-\d+)?))$`
queryFields	query		string[]	要提取的其他字段的列表。前任。 “NumberOfGuests，StoreNumber”
stringIndexType	query		StringIndexType	用于计算字符串偏移量和长度的方法。

请求正文

Media Types: "application/octet-stream", "application/pdf", "image/jpeg", "image/png", "image/tiff", "image/bmp", "image/heif", "text/html", "application/vnd.openxmlformats-officedocument.wordprocessingml.document", "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet", "application/vnd.openxmlformats-officedocument.presentationml.presentation"

名称	类型	说明
input	string	输入内容。

响应

名称	类型	说明
202 Accepted		已接受请求进行处理，但尚未完成处理。标头 Operation-Location: string Retry-After: integer
Other Status Codes	ErrorResponse	意外的错误响应。

名称

类型

说明

202 Accepted

已接受请求进行处理，但尚未完成处理。

标头

Operation-Location: string
Retry-After: integer

Other Status Codes

ErrorResponse

意外的错误响应。

安全性

Ocp-Apim-Subscription-Key

类型: apiKey
在: header

OAuth2Auth

类型: oauth2
流向: accessCode
授权 URL: https://login.microsoftonline.com/common/oauth2/authorize
令牌 URL: https://login.microsoftonline.com/common/oauth2/token

作用域

名称	说明
https://cognitiveservices.azure.com/.default

示例

Analyze Document from Url

示例请求

HTTP

POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel:analyze?api-version=2024-07-31-preview&pages=1-2,4&locale=en-US&stringIndexType=textElements

"{binaryFile}"

示例响应

状态代码:: 202

Operation-Location: https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-07-31-preview

定义

名称	说明
AnalyzeOutputOption	在分析期间要生成的其他输出。
ContentFormat	分析结果中内容的格式。
DocumentAnalysisFeature	要启用的文档分析功能。
Error	错误对象。
ErrorResponse	错误响应对象。
InnerError	包含有关错误的更具体信息的对象。
StringIndexType	用于计算字符串偏移量和长度的方法。

AnalyzeOutputOption

在分析期间要生成的其他输出。

名称	类型	说明
figures	string	生成检测到的图形的裁剪图像。
pdf	string	生成可搜索的 PDF 输出。

ContentFormat

分析结果中内容的格式。

名称	类型	说明
markdown	string	带有节标题、表格等的文档内容的 Markdown 表示形式。
text	string	不带任何格式的文档内容的纯文本表示形式。

DocumentAnalysisFeature

要启用的文档分析功能。

名称	类型	说明
barcodes	string	启用文档中条形码检测。
formulas	string	启用文档中数学表达式的检测。
keyValuePairs	string	启用文档中常规键值对（窗体字段）的检测。
languages	string	启用文本内容语言检测。
ocrHighResolution	string	以更高的分辨率执行 OCR 以处理带有精细打印的文档。
queryFields	string	通过 queryFields 查询参数启用其他字段的提取。
styleFont	string	启用各种字体样式的识别。

Error

错误对象。

名称	类型	说明
code	string	服务器定义的错误代码集之一。
details	Error[]	导致此报告错误的特定错误的详细信息数组。
innererror	InnerError	包含与当前对象有关错误的更具体信息的对象。
message	string	错误的人工可读表示形式。
target	string	错误的目标。

ErrorResponse

错误响应对象。

名称	类型	说明
error	Error	错误信息。

InnerError

包含有关错误的更具体信息的对象。

名称	类型	说明
code	string	服务器定义的错误代码集之一。
innererror	InnerError	内部错误。
message	string	错误的人工可读表示形式。

StringIndexType

用于计算字符串偏移量和长度的方法。

名称	类型	说明
textElements	string	由 Unicode 8.0.0 定义的用户感知显示字符或 grapheme 群集。
unicodeCodePoint	string	由单个 unicode 代码点表示的字符单元。由 Python 3 使用。
utf16CodeUnit	string	由 16 位 Unicode 代码单元表示的字符单元。由 JavaScript、Java 和 .NET 使用。

通过

Document Models - Analyze Document From Stream

URI 参数

请求正文

响应

安全性

Ocp-Apim-Subscription-Key

OAuth2Auth

作用域

示例

Analyze Document from Url

示例请求

示例响应

定义

AnalyzeOutputOption

ContentFormat

DocumentAnalysisFeature

Error

ErrorResponse

InnerError

StringIndexType

其他资源