Share via


Document Models - Analyze Document

A dokumentumot a dokumentummodellel elemzi.

POST {endpoint}/documentintelligence/documentModels/{modelId}:analyze?_overload=analyzeDocument&api-version=2024-02-29-preview
POST {endpoint}/documentintelligence/documentModels/{modelId}:analyze?_overload=analyzeDocument&api-version=2024-02-29-preview&pages={pages}&locale={locale}&stringIndexType={stringIndexType}&features={features}&queryFields={queryFields}&outputContentFormat={outputContentFormat}

URI-paraméterek

Name In Kötelező Típus Description
endpoint
path True

string

A Dokumentumintelligencia szolgáltatás végpontja.

modelId
path True

string

Egyedi dokumentummodell neve.

Regex pattern: ^[a-zA-Z0-9][a-zA-Z0-9._~-]{1,63}$

api-version
query True

string

A művelethez használandó API-verzió.

features
query

DocumentAnalysisFeature[]

Választható elemzési funkciók listája.

locale
query

string

Területi tipp a szövegfelismeréshez és a dokumentumelemzéshez. Az érték csak a nyelvi kódot (pl. "en", "fr") vagy BCP 47 nyelvi címkét (pl. "en-US") tartalmazhatja.

outputContentFormat
query

ContentFormat

Az elemzési eredmény legfelső szintű tartalmának formátuma.

pages
query

string

Az elemezni kívánt 1-alapú oldalszámok listája. Pl. "1-3,5,7-9"

Regex pattern: ^(\d+(-\d+)?)(,\s*(\d+(-\d+)?))*$

queryFields
query

string[]

További kinyerendő mezők listája. Pl. "NumberOfGuests,StoreNumber"

stringIndexType
query

StringIndexType

A sztring eltolásának és hosszának kiszámításához használt módszer.

Kérelem törzse

Name Típus Description
base64Source

string

Az elemezni kívánt dokumentum Base64-kódolása. Meg kell adni az urlSource vagy a base64Source értéket.

urlSource

string

Elemezendő dokumentum URL-címe. Meg kell adni az urlSource vagy a base64Source értéket.

Válaszok

Name Típus Description
202 Accepted

A kérelem feldolgozásra elfogadva, de a feldolgozás még nem fejeződött be.

Headers

  • Operation-Location: string
  • Retry-After: integer
Other Status Codes

ErrorResponse

Váratlan hibaválasz.

Biztonság

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

OAuth2Auth

Type: oauth2
Flow: accessCode
Authorization URL: https://login.microsoftonline.com/common/oauth2/authorize
Token URL: https://login.microsoftonline.com/common/oauth2/token

Scopes

Name Description
https://cognitiveservices.azure.com/.default

Példák

Analyze Document from Base64
Analyze Document from Url

Analyze Document from Base64

Sample Request

POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?_overload=analyzeDocument&api-version=2024-02-29-preview&pages=1-2,4&locale=en-US&stringIndexType=textElements

{
  "base64Source": "e2Jhc2U2NEVuY29kZWRQZGZ9"
}

Sample Response

Operation-Location: https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-02-29-preview

Analyze Document from Url

Sample Request

POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel:analyze?_overload=analyzeDocument&api-version=2024-02-29-preview&pages=1-2,4&locale=en-US&stringIndexType=textElements

{
  "urlSource": "http://host.com/doc.pdf"
}

Sample Response

Operation-Location: https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-02-29-preview

Definíciók

Name Description
AnalyzeDocumentRequest

Dokumentumelemzési paraméterek.

ContentFormat

A tartalom formátuma az elemzett eredményben.

DocumentAnalysisFeature

Választható elemzési funkciók listája.

Error

A hibaobjektum.

ErrorResponse

Hibaválasz-objektum.

InnerError

Egy objektum, amely részletesebb információkat tartalmaz a hibáról.

StringIndexType

A sztring eltolásának és hosszának kiszámításához használt módszer.

AnalyzeDocumentRequest

Dokumentumelemzési paraméterek.

Name Típus Description
base64Source

string

Az elemezni kívánt dokumentum Base64-kódolása. Meg kell adni az urlSource vagy a base64Source értéket.

urlSource

string

Elemezendő dokumentum URL-címe. Meg kell adni az urlSource vagy a base64Source értéket.

ContentFormat

A tartalom formátuma az elemzett eredményben.

Name Típus Description
markdown

string

A dokumentum tartalmának Markdown-ábrázolása szakaszfejlécekkel, táblázatokkal stb.

text

string

A dokumentum tartalmának egyszerű szöveges megjelenítése formázás nélkül.

DocumentAnalysisFeature

Választható elemzési funkciók listája.

Name Típus Description
barcodes

string

Engedélyezze a vonalkódok észlelését a dokumentumban.

formulas

string

Matematikai kifejezések észlelésének engedélyezése a dokumentumban.

keyValuePairs

string

Engedélyezze az általános kulcsértékpárok (űrlapmezők) észlelését a dokumentumban.

languages

string

Engedélyezze a szöveges tartalom nyelvének észlelését.

ocrHighResolution

string

Hajtsa végre az OCR-t nagyobb felbontásban a dokumentumok finom nyomtatással való kezeléséhez.

queryFields

string

További mezők kinyerésének engedélyezése a queryFields lekérdezési paraméterrel.

styleFont

string

Engedélyezze a különböző betűstílusok felismerését.

Error

A hibaobjektum.

Name Típus Description
code

string

A kiszolgáló által definiált hibakódok egyike.

details

Error[]

A jelentett hibához vezető konkrét hibák részleteinek tömbje.

innererror

InnerError

Egy objektum, amely az aktuális objektumnál pontosabb információkat tartalmaz a hibáról.

message

string

A hiba emberi olvasásra alkalmas ábrázolása.

target

string

A hiba célja.

ErrorResponse

Hibaválasz-objektum.

Name Típus Description
error

Error

Hibainformáció.

InnerError

Egy objektum, amely részletesebb információkat tartalmaz a hibáról.

Name Típus Description
code

string

A kiszolgáló által definiált hibakódok egyike.

innererror

InnerError

Belső hiba.

message

string

A hiba emberi olvasásra alkalmas ábrázolása.

StringIndexType

A sztring eltolásának és hosszának kiszámításához használt módszer.

Name Típus Description
textElements

string

A Unicode 8.0.0 által meghatározott felhasználói megjelenítési karakter vagy grapheme-fürt.

unicodeCodePoint

string

Egyetlen Unicode-kódpont által képviselt karakteregység. A Python 3 használja.

utf16CodeUnit

string

Egy 16 bites Unicode-kódegység által képviselt karakteregység. A JavaScript, a Java és a .NET által használt.