共用方式為


Document Classifiers - Get Classify Result

取得文件分類器的結果。

GET {endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-07-31-preview

URI 參數

名稱 位於 必要 類型 Description
classifierId
path True

string

唯一的檔分類器名稱。

Regex 模式: ^[a-zA-Z0-9][a-zA-Z0-9._~-]{1,63}$

endpoint
path True

string

uri

Document Intelligence 服務端點。

resultId
path True

string

uuid

分析作業結果標識碼。

api-version
query True

string

要用於這項作業的 API 版本。

回應

名稱 類型 Description
200 OK

AnalyzeResultOperation

要求已成功。

Other Status Codes

ErrorResponse

未預期的錯誤回應。

安全性

Ocp-Apim-Subscription-Key

類型: apiKey
位於: header

OAuth2Auth

類型: oauth2
Flow: accessCode
授權 URL: https://login.microsoftonline.com/common/oauth2/authorize
權杖 URL: https://login.microsoftonline.com/common/oauth2/token

範圍

名稱 Description
https://cognitiveservices.azure.com/.default

範例

Get Classify Document Result

範例要求

GET https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/myClassifier/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-07-31-preview

範例回覆

{
  "status": "succeeded",
  "createdDateTime": "2021-09-24T13:00:46Z",
  "lastUpdatedDateTime": "2021-09-24T13:00:49Z",
  "analyzeResult": {
    "apiVersion": "2024-07-31-preview",
    "modelId": "myClassifier",
    "stringIndexType": "textElements",
    "contentFormat": "text",
    "content": "",
    "pages": [
      {
        "pageNumber": 1,
        "width": 8.5,
        "height": 11,
        "unit": "inch",
        "spans": []
      },
      {
        "pageNumber": 2,
        "width": 8.5,
        "height": 11,
        "unit": "inch",
        "spans": []
      },
      {
        "pageNumber": 3,
        "width": 8.5,
        "height": 11,
        "unit": "inch",
        "spans": []
      }
    ],
    "documents": [
      {
        "docType": "formA",
        "boundingRegions": [
          {
            "pageNumber": 1,
            "polygon": [
              0,
              0,
              8.5,
              0,
              8.5,
              11,
              0,
              11
            ]
          },
          {
            "pageNumber": 2,
            "polygon": [
              0,
              0,
              8.5,
              0,
              8.5,
              11,
              0,
              11
            ]
          }
        ],
        "confidence": 0.97,
        "spans": []
      },
      {
        "docType": "formB",
        "boundingRegions": [
          {
            "pageNumber": 3,
            "polygon": [
              0,
              0,
              8.5,
              0,
              8.5,
              11,
              0,
              11
            ]
          }
        ],
        "confidence": 0.97,
        "spans": []
      }
    ]
  }
}

定義

名稱 Description
AddressValue

位址域值。

AnalyzeResult

檔分析結果。

AnalyzeResultOperation

分析作業的狀態和結果。

BoundingRegion

在輸入的特定頁面上系結多邊形。

ContentFormat

分析結果中的內容格式。

CurrencyValue

貨幣域值。

Document

物件,描述檔的位置和語意內容。

DocumentBarcode

條碼物件。

DocumentBarcodeKind

條碼種類。

DocumentCaption

描述數據表或圖形的 caption 物件。

DocumentField

物件,表示域值的內容和位置。

DocumentFieldType

域值的語意數據類型。

DocumentFigure

物件,表示檔中的圖表。

DocumentFootnote

描述數據表或圖表的腳注物件。

DocumentFormula

公式物件。

DocumentFormulaKind

公式種類。

DocumentKeyValueElement

物件,表示索引鍵/值組中的欄位索引鍵或值。

DocumentKeyValuePair

物件,代表具有不同欄位卷標的表單域(索引鍵)和域值(可能是空的)。

DocumentLanguage

物件,表示指定文字範圍的偵測到語言。

DocumentLine

內容行物件,由相鄰的內容元素序列組成,例如文字和選取標記。

DocumentPage

從輸入擷取自頁面的內容和版面配置專案。

DocumentParagraph

包含連續行的段落物件,通常具有一般對齊和間距。

DocumentSection

物件,表示檔中的區段。

DocumentSelectionMark

選取標記物件,代表複選框、單選按鈕和其他表示選取範圍的元素。

DocumentSelectionMarkState

選取標記的狀態。

DocumentSignatureType

簽章是否存在。

DocumentSpan

串連內容屬性的連續區域,指定為位移和長度。

DocumentStyle

物件,表示觀察到的文字樣式。

DocumentTable

表格物件,包含以矩形版面配置排列的表格單元格。

DocumentTableCell

物件,表示數據表單元格的位置和內容。

DocumentTableCellKind

表格儲存格種類。

DocumentWord

由連續字元序列組成的 word 物件。 對於非空格分隔的語言,例如中文、日文和韓文,每個字元都會以自己的單字表示。

Error

error 物件。

ErrorResponse

錯誤回應物件。

FontStyle

字形。

FontWeight

字型粗細。

InnerError

物件,包含有關錯誤的更特定資訊。

LengthUnit

寬度、高度和多邊形屬性所使用的單位。 針對影像,單位為「圖元」。 若為 PDF,單位為「英吋」。

OperationStatus

作業狀態。

ParagraphRole

段落的語意角色。

StringIndexType

用來計算字串位移和長度的方法。

Warning

error 物件。

AddressValue

位址域值。

名稱 類型 Description
city

string

城市、鎮、村等的名稱。

cityDistrict

string

紐約市的布魯克林或倫敦威斯敏斯特市等城市內的地區或區。

countryRegion

string

國家/地區。

house

string

組建名稱,例如世界貿易中心。

houseNumber

string

房屋或建築編號。

level

string

樓層號碼,例如 3F。

poBox

string

郵局票房號碼。

postalCode

string

用於郵件排序的郵遞區號。

road

string

街道名稱。

state

string

一級行政區。

stateDistrict

string

特定地區使用的第二級行政部門。

streetAddress

string

街道層級位址,不包括城市、州、國家/地區和郵遞區號。

suburb

string

非官方社區名稱,如唐人街。

unit

string

Apartment 或辦公室號碼

AnalyzeResult

檔分析結果。

名稱 類型 Description
apiVersion

string

用來產生此結果的 API 版本。

content

string

依閱讀順序串連所有文字和視覺元素的字串表示。

contentFormat

ContentFormat

分析結果最上層內容的格式。

documents

Document[]

已擷取的檔。

figures

DocumentFigure[]

擷取的圖形。

keyValuePairs

DocumentKeyValuePair[]

擷取的索引鍵/值組。

languages

DocumentLanguage[]

偵測到的語言。

modelId

string

用來產生此結果的檔模型標識碼。

pages

DocumentPage[]

分析的頁面。

paragraphs

DocumentParagraph[]

擷取的段落。

sections

DocumentSection[]

擷取的區段。

stringIndexType

StringIndexType

用來計算字串位移和長度的方法。

styles

DocumentStyle[]

擷取的字型樣式。

tables

DocumentTable[]

擷取的數據表。

warnings

Warning[]

遇到的警告清單。

AnalyzeResultOperation

分析作業的狀態和結果。

名稱 類型 Description
analyzeResult

AnalyzeResult

檔分析結果。

createdDateTime

string

提交分析作業的日期和時間 (UTC)。

error

Error

在檔案分析期間發生錯誤。

lastUpdatedDateTime

string

上次更新狀態的日期和時間 (UTC)。

status

OperationStatus

作業狀態。 notStarted、執行中、成功或失敗

BoundingRegion

在輸入的特定頁面上系結多邊形。

名稱 類型 Description
pageNumber

integer

包含周框區域的頁碼,以 1 為起始的頁碼。

polygon

number[]

頁面上的周框多邊形,如果未指定,則為整個頁面。 相對於頁面左上方指定的座標。 數位代表多邊形頂點的 x、y 值,相對於元素方向,從左邊順時針方向(-180 度包含)。

ContentFormat

分析結果中的內容格式。

名稱 類型 Description
markdown

string

具有區段標題、表格等的文件內容的 Markdown 表示法。

text

string

檔內容的純文本表示,沒有任何格式設定。

CurrencyValue

貨幣域值。

名稱 類型 Description
amount

number

貨幣金額。

currencyCode

string

已解決的貨幣代碼 (ISO 4217),如果有的話。

currencySymbol

string

貨幣符號標籤,如果有的話。

Document

物件,描述檔的位置和語意內容。

名稱 類型 Description
boundingRegions

BoundingRegion[]

涵蓋檔的周框區域。

confidence

number

正確擷取檔的信心。

docType

string

檔案類型。

fields

<string,  DocumentField>

具名域值的字典。

spans

DocumentSpan[]

以閱讀順序串連內容的檔案位置。

DocumentBarcode

條碼物件。

名稱 類型 Description
confidence

number

正確擷取條碼的信心。

kind

DocumentBarcodeKind

條碼種類。

polygon

number[]

條碼的周框多邊形,與頁面左上角相對指定的座標。 數位代表多邊形頂點的 x、y 值,相對於元素方向,從左邊順時針方向(-180 度包含)。

span

DocumentSpan

讀取順序串連內容中條碼的位置。

value

string

條碼值。

DocumentBarcodeKind

條碼種類。

名稱 類型 Description
Aztec

string

Aztec 程式代碼,如 ISO/IEC 24778:2008 中所定義。

Codabar

string

Codabar 條碼,如 ANSI/AIM BC3-1995 中所定義。

Code128

string

代碼 128 條碼,如 ISO/IEC 15417:2007 中所定義。

Code39

string

代碼 39 條碼,如 ISO/IEC 16388:2007 中所定義。

Code93

string

代碼 93 條碼,如 ANSI/AIM BC5-1995 中所定義。

DataBar

string

GS1 DataBar 條碼。

DataBarExpanded

string

GS1 DataBar 已展開條碼。

DataMatrix

string

數據矩陣程序代碼,如 ISO/IEC 16022:2006 中所定義。

EAN13

string

GS1 13 位數的國際文章編號(歐洲文章編號)。

EAN8

string

GS1 8 位數的國際文章編號(歐洲文章編號)。

ITF

string

交錯 5 個條碼中的 2,如 ANSI/AIM BC2-1995 中所定義。

MaxiCode

string

MaxiCode,如 ISO/IEC 16023:2000 中所定義。

MicroQRCode

string

Micro QR 代碼,如 ISO/IEC 23941:2022 中所定義。

PDF417

string

PDF417,如 ISO 15438 中所定義。

QRCode

string

QR 代碼,如 ISO/IEC 18004:2015 中所定義。

UPCA

string

GS1 12 位數通用產品代碼。

UPCE

string

GS1 6 位數通用產品代碼。

DocumentCaption

描述數據表或圖形的 caption 物件。

名稱 類型 Description
boundingRegions

BoundingRegion[]

涵蓋標題的周框區域。

content

string

標題的內容。

elements

string[]

標題的子專案。

spans

DocumentSpan[]

閱讀順序中標題的位置串連內容。

DocumentField

物件,表示域值的內容和位置。

名稱 類型 Description
boundingRegions

BoundingRegion[]

涵蓋欄位的周框區域。

confidence

number

正確擷取字段的信心。

content

string

欄位內容。

spans

DocumentSpan[]

讀取順序中欄位的位置串連內容。

type

DocumentFieldType

域值的數據類型。

valueAddress

AddressValue

位址值。

valueArray

DocumentField[]

域值的陣列。

valueBoolean

boolean

布爾值。

valueCountryRegion

string

3 個字母的國家/地區代碼值 (ISO 3166-1 alpha-3)。

valueCurrency

CurrencyValue

貨幣值。

valueDate

string

YYYY-MM-DD 格式的日期值(ISO 8601)。

valueInteger

integer

整數值。

valueNumber

number

浮點值。

valueObject

<string,  DocumentField>

具名域值的字典。

valuePhoneNumber

string

E.164 格式的電話號碼值(例如 +19876543210)。

valueSelectionGroup

string[]

選取群組值。

valueSelectionMark

DocumentSelectionMarkState

選取標記值。

valueSignature

DocumentSignatureType

簽章是否存在。

valueString

string

字串值。

valueTime

string

hh:mm:ss 格式的時間值(ISO 8601)。

DocumentFieldType

域值的語意數據類型。

名稱 類型 Description
address

string

剖析的位址。

array

string

相同類型的子欄位清單。

boolean

string

布爾值,標準化為 true 或 false。

countryRegion

string

國家/地區,標準化為 ISO 3166-1 alpha-3 格式(例如美國)。

currency

string

具有選擇性貨幣符號和單位的貨幣金額。

date

string

日期,標準化為 ISO 8601 (YYYY-MM-DD) 格式。

integer

string

整數,標準化為64位帶正負號的整數。

number

string

浮點數,標準化為雙精確度浮點數。

object

string

可能不同類型的子欄位具名清單。

phoneNumber

string

電話號碼,標準化為 E.164 (+{CountryCode}{SubscriberNumber}) 格式。

selectionGroup

string

選取字串值的陣列。

selectionMark

string

是否選取欄位?

signature

string

簽章是否存在?

string

string

純文本。

time

string

時間,標準化為 ISO 8601 (hh:mm:ss) 格式。

DocumentFigure

物件,表示檔中的圖表。

名稱 類型 Description
boundingRegions

BoundingRegion[]

涵蓋此圖的周框區域。

caption

DocumentCaption

與圖表相關聯的標題。

elements

string[]

圖形的子元素,不包括任何標題或腳註。

footnotes

DocumentFootnote[]

與圖表相關聯的腳注清單。

id

string

圖標識碼。

spans

DocumentSpan[]

讀取順序中圖形的位置串連內容。

DocumentFootnote

描述數據表或圖表的腳注物件。

名稱 類型 Description
boundingRegions

BoundingRegion[]

涵蓋腳注的周框區域。

content

string

腳注的內容。

elements

string[]

腳注的子專案。

spans

DocumentSpan[]

閱讀順序中腳註的位置串連內容。

DocumentFormula

公式物件。

名稱 類型 Description
confidence

number

正確擷取公式的信賴度。

kind

DocumentFormulaKind

公式種類。

polygon

number[]

公式的周框多邊形,與頁面左上角相對指定的座標。 數位代表多邊形頂點的 x、y 值,相對於元素方向,從左邊順時針方向(-180 度包含)。

span

DocumentSpan

讀取順序中公式的位置串連內容。

value

string

描述公式的 LaTex 運算式。

DocumentFormulaKind

公式種類。

名稱 類型 Description
display

string

顯示模式中的公式,會佔用整行。

inline

string

內嵌在段落內容中的公式。

DocumentKeyValueElement

物件,表示索引鍵/值組中的欄位索引鍵或值。

名稱 類型 Description
boundingRegions

BoundingRegion[]

涵蓋索引鍵/值元素的周框區域。

content

string

依讀取順序串連索引鍵/值元素的內容。

spans

DocumentSpan[]

讀取順序中索引鍵/值專案的位置串連內容。

DocumentKeyValuePair

物件,代表具有不同欄位卷標的表單域(索引鍵)和域值(可能是空的)。

名稱 類型 Description
confidence

number

正確擷取機碼/值組的信賴度。

key

DocumentKeyValueElement

索引鍵/值組的欄位標籤。

value

DocumentKeyValueElement

機碼/值組的域值。

DocumentLanguage

物件,表示指定文字範圍的偵測到語言。

名稱 類型 Description
confidence

number

正確識別語言的信心。

locale

string

偵測到的語言。 值可能是 ISO 639-1 語言代碼(例如 “en”、“fr”) 或 BCP 47 語言標記(例如 “zh-Hans” )。

spans

DocumentSpan[]

語言所套用之串連內容中的文字專案位置。

DocumentLine

內容行物件,由相鄰的內容元素序列組成,例如文字和選取標記。

名稱 類型 Description
content

string

以讀取順序串連包含之元素的內容。

polygon

number[]

線條的周框多邊形,與頁面左上角相對指定的座標。 數位代表多邊形頂點的 x、y 值,相對於元素方向,從左邊順時針方向(-180 度包含)。

spans

DocumentSpan[]

閱讀順序中串連內容的行位置。

DocumentPage

從輸入擷取自頁面的內容和版面配置專案。

名稱 類型 Description
angle

number

以順時針方向測量內容的一般方向,以度為單位 (-180, 180]。

barcodes

DocumentBarcode[]

從頁面擷取的條碼。

formulas

DocumentFormula[]

從頁面擷取的公式。

height

number

影像/PDF 的高度,分別以圖元/英吋為單位。

lines

DocumentLine[]

從頁面擷取的行,可能同時包含文字和視覺元素。

pageNumber

integer

輸入檔中以 1 起始的頁碼。

selectionMarks

DocumentSelectionMark[]

從頁面擷取選取標記。

spans

DocumentSpan[]

讀取順序中頁面的位置串連內容。

unit

LengthUnit

寬度、高度和多邊形屬性所使用的單位。 針對影像,單位為「圖元」。 若為 PDF,單位為「英吋」。

width

number

影像/PDF 的寬度,分別以圖元/英吋為單位。

words

DocumentWord[]

從頁面擷取的字組。

DocumentParagraph

包含連續行的段落物件,通常具有一般對齊和間距。

名稱 類型 Description
boundingRegions

BoundingRegion[]

涵蓋段落的周框區域。

content

string

以閱讀順序串連段落的內容。

role

ParagraphRole

段落的語意角色。

spans

DocumentSpan[]

閱讀順序中段落的位置串連內容。

DocumentSection

物件,表示檔中的區段。

名稱 類型 Description
elements

string[]

區段的子專案。

spans

DocumentSpan[]

讀取順序中區段串連內容的位置。

DocumentSelectionMark

選取標記物件,代表複選框、單選按鈕和其他表示選取範圍的元素。

名稱 類型 Description
confidence

number

正確擷取選取標記的信心。

polygon

number[]

選取標記的周框多邊形,與頁面左上角相對指定的座標。 數位代表多邊形頂點的 x、y 值,相對於元素方向,從左邊順時針方向(-180 度包含)。

span

DocumentSpan

讀取順序中選取標記的位置串連內容。

state

DocumentSelectionMarkState

選取標記的狀態。

DocumentSelectionMarkState

選取標記的狀態。

名稱 類型 Description
selected

string

選取標記會選取,通常以選取標記內的複選 ✓ 或交叉 X 表示。

unselected

string

未選取選取標記。

DocumentSignatureType

簽章是否存在。

名稱 類型 Description
signed

string

偵測到簽章。

unsigned

string

不會偵測到簽章。

DocumentSpan

串連內容屬性的連續區域,指定為位移和長度。

名稱 類型 Description
length

integer

範圍所代表內容中的字元數。

offset

integer

範圍所表示之內容之以零起始的索引。

DocumentStyle

物件,表示觀察到的文字樣式。

名稱 類型 Description
backgroundColor

string

#rrggbb 十六進位格式的背景色彩。

color

string

#rrggbb 十六進位格式的前景色彩。

confidence

number

正確識別樣式的信賴度。

fontStyle

FontStyle

字形。

fontWeight

FontWeight

字型粗細。

isHandwritten

boolean

內容是手寫的嗎?

similarFontFamily

string

視覺上最類似字型系列中的字型集合,後援字型遵循 CSS 慣例(例如 'Arial, sans-serif')。

spans

DocumentSpan[]

樣式所套用之串連內容中的文字專案位置。

DocumentTable

表格物件,包含以矩形版面配置排列的表格單元格。

名稱 類型 Description
boundingRegions

BoundingRegion[]

涵蓋數據表的周框區域。

caption

DocumentCaption

與數據表相關聯的標題。

cells

DocumentTableCell[]

表格中包含的儲存格。

columnCount

integer

數據表中的數據行數目。

footnotes

DocumentFootnote[]

與數據表相關聯的腳注清單。

rowCount

integer

數據表中的數據列數目。

spans

DocumentSpan[]

讀取順序中數據表的位置串連內容。

DocumentTableCell

物件,表示數據表單元格的位置和內容。

名稱 類型 預設值 Description
boundingRegions

BoundingRegion[]

涵蓋表格儲存格的周框區域。

columnIndex

integer

單元格的數據行索引。

columnSpan

integer

1

此儲存格所跨越的數據行數目。

content

string

以讀取順序串連數據表單元格的內容。

elements

string[]

數據表單元格的子專案。

kind

DocumentTableCellKind

content

表格儲存格種類。

rowIndex

integer

單元格的數據列索引。

rowSpan

integer

1

此儲存格所跨越的數據列數目。

spans

DocumentSpan[]

讀取順序中數據表單元格的位置串連內容。

DocumentTableCellKind

表格儲存格種類。

名稱 類型 Description
columnHeader

string

描述數據行的內容。

content

string

包含主要內容/數據。

description

string

描述數據表中 (部分) 中的內容。

rowHeader

string

描述數據列的內容。

stubHead

string

描述數據列標頭,通常位於表格左上角。

DocumentWord

由連續字元序列組成的 word 物件。 對於非空格分隔的語言,例如中文、日文和韓文,每個字元都會以自己的單字表示。

名稱 類型 Description
confidence

number

正確擷取單字的信心。

content

string

文字內容的文字內容。

polygon

number[]

文字的周框多邊形,與頁面左上角相對指定的座標。 數位代表多邊形頂點的 x、y 值,相對於元素方向,從左邊順時針方向(-180 度包含)。

span

DocumentSpan

閱讀順序中文字的位置串連內容。

Error

error 物件。

名稱 類型 Description
code

string

其中一組伺服器定義的錯誤碼。

details

Error[]

導致此錯誤之特定錯誤的詳細數據陣列。

innererror

InnerError

物件,包含與目前對象有關錯誤更具體的資訊。

message

string

錯誤的人類可讀取表示法。

target

string

錯誤的目標。

ErrorResponse

錯誤回應物件。

名稱 類型 Description
error

Error

錯誤資訊。

FontStyle

字形。

名稱 類型 Description
italic

string

字元會以視覺方式斜向右邊。

normal

string

字元通常表示。

FontWeight

字型粗細。

名稱 類型 Description
bold

string

字元會以較厚的筆劃表示。

normal

string

字元通常表示。

InnerError

物件,包含有關錯誤的更特定資訊。

名稱 類型 Description
code

string

其中一組伺服器定義的錯誤碼。

innererror

InnerError

內部錯誤。

message

string

錯誤的人類可讀取表示法。

LengthUnit

寬度、高度和多邊形屬性所使用的單位。 針對影像,單位為「圖元」。 若為 PDF,單位為「英吋」。

名稱 類型 Description
inch

string

PDF 檔案的長度單位。

pixel

string

圖像檔案的長度單位。

OperationStatus

作業狀態。

名稱 類型 Description
canceled

string

作業已取消。

completed

string

作業已完成。

failed

string

作業失敗。

notStarted

string

作業尚未啟動。

running

string

作業正在進行中。

succeeded

string

作業已成功。

ParagraphRole

段落的語意角色。

名稱 類型 Description
footnote

string

通常放在頁面上主要內容之後的附註。

formulaBlock

string

公式區塊,通常具有共用對齊方式。

pageFooter

string

靠近頁面下邊緣的文字。

pageHeader

string

靠近頁面上邊緣的文字。

pageNumber

string

頁碼。

sectionHeading

string

描述檔區段的子標題。

title

string

描述整個檔的最上層標題。

StringIndexType

用來計算字串位移和長度的方法。

名稱 類型 Description
textElements

string

使用者感知的顯示字元或 grapheme 叢集,如 Unicode 8.0.0 所定義。

unicodeCodePoint

string

以單一 Unicode 字碼點表示的字元單位。 由 Python 3 使用。

utf16CodeUnit

string

以16位Unicode字碼單位表示的字元單位。 由 JavaScript、Java 和 .NET 使用。

Warning

error 物件。

名稱 類型 Description
code

string

其中一組伺服器定義的警告碼。

message

string

人類可讀取的警告表示法。

target

string

錯誤的目標。