Content Analyzers - Analyze Binary

Dienst:: Azure AI Services

API-Version:: 2025-11-01

Extrahiere Inhalte und Felder aus den Eingaben.

POST {endpoint}/contentunderstanding/analyzers/{analyzerId}:analyzeBinary?api-version=2025-11-01

Mit optionalen Parametern:

POST {endpoint}/contentunderstanding/analyzers/{analyzerId}:analyzeBinary?api-version=2025-11-01&stringEncoding={stringEncoding}&processingLocation={processingLocation}&range={range}

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
analyzerId	path	True	string minLength: 1 maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$	Die eindeutige Kennung des Analysators.
endpoint	path	True	string (uri)	Inhaltsverständnis des Service-Endpunkts.
api-version	query	True	string minLength: 1	Hierbei handelt es sich um die für diesen Vorgang zu verwendende API-Version.
processingLocation	query		ProcessingLocation	Der Ort, an dem die Daten verarbeitet werden können. Standardmäßig steht es auf global.
range	query		string	Bereich des zu analysierenden Inputs (z. B. `1-3,5,9-`). Dokumentinhalte verwenden 1-basierte Seitenzahlen, während audiovisuelle Inhalte ganzzahlige Millisekunden verwenden.
stringEncoding	query		string	Das String-Codierungsformat für Inhalte spannt sich in der Antwort. Mögliche Werte sind 'codePoint', 'utf16' und `utf8`. Standardmäßig ist `codePoint`.")

Anforderungsheader

Media Types: "*/*"

Name	Erforderlich	Typ	Beschreibung
x-ms-client-request-id		string (uuid)	Ein undurchsichtiger, global eindeutiger, clientgenerierter Zeichenfolgenbezeichner für die Anforderung.

Anforderungstext

Media Types: "*/*"

Name	Typ	Beschreibung
input	string (binary)	Der binäre Inhalt des Dokuments zu analysieren.

Antworten

Name	Typ	Beschreibung
202 Accepted	ContentAnalyzerAnalyzeOperationStatus	Die Anforderung wurde zur Verarbeitung akzeptiert, die Verarbeitung wurde jedoch noch nicht abgeschlossen. Header Operation-Location: string x-ms-client-request-id: string
Other Status Codes	Azure.Core.Foundations.ErrorResponse	Unerwartete Fehlerantwort. Header x-ms-error-code: string

Name

Typ

Beschreibung

202 Accepted

ContentAnalyzerAnalyzeOperationStatus

Die Anforderung wurde zur Verarbeitung akzeptiert, die Verarbeitung wurde jedoch noch nicht abgeschlossen.

Header

Operation-Location: string
x-ms-client-request-id: string

Other Status Codes

Azure.Core.Foundations.ErrorResponse

Unerwartete Fehlerantwort.

Header

x-ms-error-code: string

Sicherheit

Ocp-Apim-Subscription-Key

Schlüsselbasierte Authentifizierung mit dem Zugangsschlüssel der Azure-Ressource.

Typ: apiKey
In: header

EntraIdToken

Microsoft Entra ID OAuth2-Authentifizierung mit einem Zugangstoken.

Typ: oauth2
Ablauf: accessCode
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/authorize
Token-URL: https://login.microsoftonline.com/common/oauth2/token

Bereiche

Name	Beschreibung
https://cognitiveservices.azure.com/.default

Beispiele

Analyze File

Beispielanforderung

HTTP

POST {endpoint}/contentunderstanding/analyzers/myAnalyzer:analyzeBinary?api-version=2025-11-01

"RXhhbXBsZSBGaWxl"

Beispiel für eine Antwort

Statuscode:: 202

Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzerResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01

{
  "id": "3b31320d-8bab-4f88-b19c-2322a7f11034",
  "status": "NotStarted"
}

Definitionen

Name	Beschreibung
AnalysisContentKind	Eine Art Medieninhalt.
AnalysisResult	Analyse des Vorgangsergebnisses.
ArrayField	Array-Feld aus dem Inhalt extrahiert.
AudioVisualContent	Audio-visuelle Inhalte. Zum Beispiel Audio/WAV, Video/MP4.
AudioVisualContentSegment	Erkanntes Audio-/Videoinhaltssegment.
Azure.Core.Foundations.Error	Das Fehlerobjekt.
Azure.Core.Foundations.ErrorResponse	Eine Antwort, die Fehlerdetails enthält.
Azure.Core.Foundations.InnerError	Ein Objekt, das spezifischere Informationen zum Fehler enthält. Gemäß den Richtlinien der Azure-REST-API: . https://aka.ms/AzureRestApiGuidelines#handling-errors
BooleanField	Boolesches Feld aus dem Inhalt extrahiert.
ContentAnalyzerAnalyzeOperationStatus	Stellt Statusdetails zur Analyse der Operationen bereit.
ContentFieldType	Semantischer Datentyp des Feldwerts.
ContentSpan	Position des Elements im Markdown, angegeben als Zeichenversatz und Länge.
DateField	Datumsfeld aus dem Inhalt extrahiert.
DocumentAnnotation	Anmerkung in einem Dokument, wie zum Beispiel ein Durchstreichen oder ein Kommentar.
DocumentAnnotationComment	Kommentar im Zusammenhang mit einer Dokumentanmerkung.
DocumentAnnotationKind	Dokumentenannotation.
DocumentBarcode	Barcode in einem Dokument.
DocumentBarcodeKind	Barcodeart.
DocumentCaption	Bildunterschrift einer Tabelle oder Figur.
DocumentChartFigure	Abbildung mit einem Diagramm, wie zum Beispiel Balkendiagramm, Liniendiagramm oder Tortendiagramm.
DocumentContent	Dokumentinhalt. Zum Beispiel Text/Klartext, Anwendung/PDF, Bild/JPEG.
DocumentContentSegment	Erkanntes Dokumenteninhaltssegment.
DocumentFootnote	Fußnote einer Tabelle oder Figur.
DocumentFormula	Mathematische Formel in einem Dokument.
DocumentFormulaKind	Formeltyp.
DocumentHyperlink	Hyperlink in einem Dokument, zum Beispiel ein Link zu einer Webseite oder einer E-Mail-Adresse.
DocumentLine	Zeile in einem Dokument, bestehend aus einer zusammenhängenden Wortfolge.
DocumentMermaidFigure	Abbildung mit einem Diagramm, wie einem Flussdiagramm oder Netzwerkdiagramm.
DocumentPage	Inhalt von einer Dokumentseite.
DocumentParagraph	Absatz in einem Dokument, der in der Regel aus einer zusammenhängenden Zeilenfolge mit gemeinsamer Ausrichtung und Abstand besteht.
DocumentSection	Abschnitt in einem Dokument.
DocumentTable	Tabelle in einem Dokument, bestehend aus Tabellenzellen, die in einem rechteckigen Layout angeordnet sind.
DocumentTableCell	Tabellenzelle in einer Dokumententabelle.
DocumentTableCellKind	Tabellenzellentyp.
DocumentWord	Wort in einem Dokument, bestehend aus einer zusammenhängenden Zeichenfolge. Bei nicht leerzeichentrennten Sprachen, z. B. Chinesisch, Japanisch und Koreanisch, wird jedes Zeichen als eigenes Wort dargestellt.
IntegerField	Ganzzahlfeld aus dem Inhalt extrahiert.
JsonField	JSON-Feld aus dem Inhalt extrahiert.
LengthUnit	Längeneinheit, die durch Breite-, Höhen- und Quelleigenschaften verwendet wird.
NumberField	Zahlenfeld aus dem Inhalt extrahiert.
ObjectField	Objektfeld aus dem Inhalt extrahiert.
OperationState	den Status des Vorgangs
ProcessingLocation	Der Ort, an dem die Daten verarbeitet werden können. Standardmäßig steht es auf global.
SemanticRole	Semantische Rolle des Absatzes.
StringField	String-Feld aus dem Inhalt extrahiert.
TimeField	Zeitfeld aus dem Inhalt extrahiert.
TranscriptPhrase	Transkriptphrase.
TranscriptWord	Transkript Wort.
UsageDetails	Nutzungsdetails.

AnalysisContentKind

Enumeration

Eine Art Medieninhalt.

Wert	Beschreibung
document	Dokumentinhalte wie PDF, Bild, SMS usw.
audioVisual	Audiovisuelle Inhalte wie mp3, mp4 usw.

AnalysisResult

Objekt

Analyse des Vorgangsergebnisses.

Name	Typ	Standardwert	Beschreibung
analyzerId	string minLength: 1 maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$		Die eindeutige Kennung des Analysators.
apiVersion	string		Die Version der API, die zur Analyse des Dokuments verwendet wird.
contents	AnalysisContent[]: AudioVisualContent[] DocumentContent[]		Der extrahierte Inhalt.
createdAt	string (date-time)		Das Datum und die Uhrzeit, an der das Ergebnis erstellt wurde.
stringEncoding	string	codePoint	Das String-Codierungsformat für Inhalte spannt sich in der Antwort. Mögliche Werte sind 'codePoint', 'utf16' und `utf8`. Standardmäßig ist `codePoint`.")
warnings	Azure.Core.Foundations.Error[]		Warnungen, die bei der Analyse des Dokuments aufgetreten sind.

ArrayField

Objekt

Array-Feld aus dem Inhalt extrahiert.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Zuversicht bei der Vorhersage des Feldwerts.
source	string	Codierte Quelle, die die Position des Feldwerts im Inhalt identifiziert.
spans	ContentSpan[]	Span(s), die mit dem Feldwert im Markdown-Inhalt verknüpft sind.
type	string: array	Semantischer Datentyp des Feldwerts.
valueArray	ContentField[]: ArrayField[] BooleanField[] DateField[] IntegerField[] JsonField[] NumberField[] ObjectField[] StringField[] TimeField[]	Array-Feldwert.

AudioVisualContent

Objekt

Audio-visuelle Inhalte. Zum Beispiel Audio/WAV, Video/MP4.

Name	Typ	Beschreibung
analyzerId	string minLength: 1 maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$	Der Analysator, der diesen Inhalt generiert hat.
cameraShotTimesMs	integer[] (int64)	Liste der Änderungen der Kameraaufnahme im Video, dargestellt durch den Zeitstempel in Millisekunden. Nur wenn returnDetails wahr sind.
category	string	Kategorie Klassifizierter Inhalt.
endTimeMs	integer (int64)	Endzeit des Inhalts in Millisekunden.
fields	object	Extrahierte Felder aus dem Inhalt.
height	integer (int32)	Höhe jedes Videobildes in Pixeln, falls zutreffend.
keyFrameTimesMs	integer[] (int64)	Liste der Keyframes im Video, dargestellt durch seinen Zeitstempel in Millisekunden. Nur wenn returnDetails wahr sind.
kind	string: audioVisual	Content-Typ.
markdown	string	Markdown-Darstellung des Inhalts.
mimeType	string	Erkannter MIME-Typ des Inhalts. Zum Beispiel Anwendungs/PDF, Bild/JPEG usw.
path	string	Der Pfad des Inhalts in der Eingabe.
segments	AudioVisualContentSegment[]	Liste der erkannten Inhaltssegmente. Nur wenn enableSegment wahr ist.
startTimeMs	integer (int64)	Startzeit des Inhalts in Millisekunden.
transcriptPhrases	TranscriptPhrase[]	Liste der Transkriptphrasen. Nur wenn returnDetails wahr sind.
width	integer (int32)	Breite jedes Videobildes in Pixeln, falls zutreffend.

AudioVisualContentSegment

Objekt

Erkanntes Audio-/Videoinhaltssegment.

Name	Typ	Beschreibung
category	string	Kategorie Klassifizierter Inhalt.
endTimeMs	integer (int64)	Endzeit des Segments in Millisekunden.
segmentId	string	Segmentbezeichner
span	ContentSpan	Spannweite des Segments im Markdown-Inhalt.
startTimeMs	integer (int64)	Startzeit des Segments in Millisekunden.

Azure.Core.Foundations.Error

Objekt

Das Fehlerobjekt.

Name	Typ	Beschreibung
code	string	Eine serverdefinierte Gruppe von Fehlercodes.
details	Azure.Core.Foundations.Error[]	Ein Array von Details zu bestimmten Fehlern, die zu diesem gemeldeten Fehler geführt haben.
innererror	Azure.Core.Foundations.InnerError	Ein Objekt, das spezifischere Informationen enthält als das aktuelle Objekt über den Fehler.
message	string	Eine lesbare Darstellung des Fehlers.
target	string	Das Ziel des Fehlers.

Azure.Core.Foundations.ErrorResponse

Objekt

Eine Antwort, die Fehlerdetails enthält.

Name	Typ	Beschreibung
error	Azure.Core.Foundations.Error	Das Fehlerobjekt.

Azure.Core.Foundations.InnerError

Objekt

Ein Objekt, das spezifischere Informationen zum Fehler enthält. Gemäß den Richtlinien der Azure-REST-API: . https://aka.ms/AzureRestApiGuidelines#handling-errors

Name	Typ	Beschreibung
code	string	Eine serverdefinierte Gruppe von Fehlercodes.
innererror	Azure.Core.Foundations.InnerError	Innerer Fehler.

BooleanField

Objekt

Boolesches Feld aus dem Inhalt extrahiert.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Zuversicht bei der Vorhersage des Feldwerts.
source	string	Codierte Quelle, die die Position des Feldwerts im Inhalt identifiziert.
spans	ContentSpan[]	Span(s), die mit dem Feldwert im Markdown-Inhalt verknüpft sind.
type	string: boolean	Semantischer Datentyp des Feldwerts.
valueBoolean	boolean	Boolesche Feldwert.

ContentAnalyzerAnalyzeOperationStatus

Objekt

Stellt Statusdetails zur Analyse der Operationen bereit.

Name	Typ	Beschreibung
error	Azure.Core.Foundations.Error	Fehlerobjekt, das den Fehler beschreibt, wenn der Status "Fehlgeschlagen" lautet.
id	string	Die eindeutige ID des Vorgangs.
result	AnalysisResult	Das Ergebnis des Vorgangs.
status	OperationState	den Status des Vorgangs
usage	UsageDetails	Nutzungsdetails der Analyseoperation.

ContentFieldType

Enumeration

Semantischer Datentyp des Feldwerts.

Wert	Beschreibung
string	Nur-Text
date	Datum, normalisiert auf ISO 8601 (YYYY-MM-DD) Format.
time	Zeit, normalisiert auf ISO 8601 (hh:mm:ss) Format.
number	Nummern als doppelte Präzisions-Gleitkomma.
integer	Ganzzahl als 64-Bit-Zeichenzahl.
boolean	Boolescher Wert
array	Liste der Teilbereiche desselben Typs.
object	Benannte Liste der Teilfelder.
json	JSON-Objekt.

ContentSpan

Objekt

Position des Elements im Markdown, angegeben als Zeichenversatz und Länge.

Name	Typ	Beschreibung
length	integer (int32)	Länge des Elements im Markdown, angegeben in Zeichen.
offset	integer (int32)	Startposition (0-indexiert) des Elements im Markdown, in Zeichen angegeben.

DateField

Objekt

Datumsfeld aus dem Inhalt extrahiert.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Zuversicht bei der Vorhersage des Feldwerts.
source	string	Codierte Quelle, die die Position des Feldwerts im Inhalt identifiziert.
spans	ContentSpan[]	Span(s), die mit dem Feldwert im Markdown-Inhalt verknüpft sind.
type	string: date	Semantischer Datentyp des Feldwerts.
valueDate	string (date)	Datumsfeldwert im ISO 8601 (YYYYY-MM-DD) Format.

DocumentAnnotation

Objekt

Anmerkung in einem Dokument, wie zum Beispiel ein Durchstreichen oder ein Kommentar.

Name	Typ	Beschreibung
author	string	Anmerkungsautor.
comments	DocumentAnnotationComment[]	Kommentare, die mit der Anmerkung verbunden sind.
createdAt	string (date-time)	Datum und Uhrzeit, wann die Annotation erstellt wurde.
id	string	Annotationskennung.
kind	DocumentAnnotationKind	Anmerkungen.
lastModifiedAt	string (date-time)	Datum und Uhrzeit, wann die Anmerkung zuletzt geändert wurde.
source	string	Position der Annotation.
spans	ContentSpan[]	Bereiche des Inhalts, der mit der Annotation verbunden ist.
tags	string[]	Tags, die mit der Annotation verbunden sind.

DocumentAnnotationComment

Objekt

Kommentar im Zusammenhang mit einer Dokumentanmerkung.

Name	Typ	Beschreibung
author	string	Autor des Kommentars.
createdAt	string (date-time)	Datum und Uhrzeit der Erstellung des Kommentars.
lastModifiedAt	string (date-time)	Datum und Uhrzeit, wann der Kommentar zuletzt geändert wurde.
message	string	Kommentarnachricht in Markdown.
tags	string[]	Tags, die mit dem Kommentar verknüpft sind.

DocumentAnnotationKind

Enumeration

Dokumentenannotation.

Wert	Beschreibung
highlight	Markiere die Anmerkung.
strikethrough	Durchgestrichene Anmerkung.
underline	Unterstreiche die Anmerkung.
italic	Kursiv Anmerkung.
bold	Fette Anmerkung.
circle	Kreisanmerkung.
note	Anmerkung zur Anmerkung.

DocumentBarcode

Objekt

Barcode in einem Dokument.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Vertrauen in die Vorhersage des Barcodes.
kind	DocumentBarcodeKind	Barcodeart.
source	string	Kodierte Quelle, die die Position des Barcodes im Inhalt identifiziert.
span	ContentSpan	Spannweite des Barcodes im Markdown-Inhalt.
value	string	Barcode-Wert.

DocumentBarcodeKind

Enumeration

Barcodeart.

Wert	Beschreibung
QRCode	QR-Code, wie in ISO/IEC 18004:2015 definiert.
PDF417	PDF417, wie in ISO 15438 definiert.
UPCA	GS1 12-stelliger Universal-Produktcode.
UPCE	GS1 sechsstelliger universeller Produktcode.
Code39	Code 39 Barcode, wie in ISO/IEC 16388:2007 definiert.
Code128	Code 128 Barcode, wie in ISO/IEC 15417:2007 definiert.
EAN8	GS1 8-stellige Internationale Artikelnummer (Europäische Artikelnummer).
EAN13	GS1 13-stellige Internationale Artikelnummer (Europäische Artikelnummer).
DataBar	GS1 DataBar-Barcode.
Code93	Code 93 Barcode, wie in ANSI/AIM BC5-1995 definiert.
Codabar	Codabar-Barcode, wie in ANSI/AIM BC3-1995 definiert.
DataBarExpanded	GS1 DataBar erweiterter Barcode.
ITF	Zwischen 2 von 5 Barcodes verwebt, wie in ANSI/AIM BC2-1995 definiert.
MicroQRCode	Mikro-QR-Code, wie in ISO/IEC 23941:2022 definiert.
Aztec	Aztekischer Code, wie in ISO/IEC 24778:2008 definiert.
DataMatrix	Datenmatrixcode, wie in ISO/IEC 16022:2006 definiert.
MaxiCode	MaxiCode, wie in ISO/IEC 16023:2000 definiert.

DocumentCaption

Objekt

Bildunterschrift einer Tabelle oder Figur.

Name	Typ	Beschreibung
content	string	Inhalt der Bildunterschrift.
elements	string[]	Kinderelemente der Bildunterschrift.
source	string	Codierte Quelle, die die Position der Bildunterschrift im Inhalt identifiziert.
span	ContentSpan	Umfang der Bildunterschrift im Markdown-Inhalt.

DocumentChartFigure

Objekt

Abbildung mit einem Diagramm, wie zum Beispiel Balkendiagramm, Liniendiagramm oder Tortendiagramm.

Name	Typ	Standardwert	Beschreibung
caption	DocumentCaption		Bildunterschrift.
content			Diagramminhalte mit Chart.js Konfiguration dargestellt.
description	string		Beschreibung der Figur.
elements	string[]		Untergeordnete Elemente der Abbildung, mit Ausnahme von Beschriftungen oder Fußnoten.
footnotes	DocumentFootnote[]		Liste der Fußnoten der Figur.
id	string		Figurenkennung.
kind	string: chart	unknown	Finde ich das Gefühl.
role	SemanticRole		Semantische Rolle der Figur.
source	string		Codierte Quelle, die die Position der Abbildung im Inhalt angibt.
span	ContentSpan		Spannweite der Figur im Markdown-Inhalt.

DocumentContent

Objekt

Dokumentinhalt. Zum Beispiel Text/Klartext, Anwendung/PDF, Bild/JPEG.

Name	Typ	Beschreibung
analyzerId	string minLength: 1 maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$	Der Analysator, der diesen Inhalt generiert hat.
annotations	DocumentAnnotation[]	Liste der Anmerkungen im Dokument. Nur wenn aktivierenAnnotations und returnDetails wahr sind.
category	string	Kategorie Klassifizierter Inhalt.
endPageNumber	integer (int32)	Endseitennummer (1-indexiert) des Inhalts.
fields	object	Extrahierte Felder aus dem Inhalt.
figures	DocumentFigure[]: DocumentChartFigure[] DocumentMermaidFigure[]	Liste der Figuren im Dokument. Nur wenn enableLayout und returnDetails wahr sind.
hyperlinks	DocumentHyperlink[]	Liste der Hyperlinks im Dokument. Nur wenn die Rückgabe der Angaben stimmt.
kind	string: document	Content-Typ.
markdown	string	Markdown-Darstellung des Inhalts.
mimeType	string	Erkannter MIME-Typ des Inhalts. Zum Beispiel Anwendungs/PDF, Bild/JPEG usw.
pages	DocumentPage[]	Liste der Seiten im Dokument.
paragraphs	DocumentParagraph[]	Liste der Absätze im Dokument. Nur wenn enableOcr und returnDetails wahr sind.
path	string	Der Pfad des Inhalts in der Eingabe.
sections	DocumentSection[]	Liste der Abschnitte im Dokument. Nur wenn enableLayout und returnDetails wahr sind.
segments	DocumentContentSegment[]	Liste der erkannten Inhaltssegmente. Nur wenn enableSegment wahr ist.
startPageNumber	integer (int32)	Startseitennummer (1-indexiert) des Inhalts.
tables	DocumentTable[]	Liste der Tabellen im Dokument. Nur wenn enableLayout und returnDetails wahr sind.
unit	LengthUnit	Längeneinheit, die durch Breite-, Höhen- und Quelleigenschaften verwendet wird. Für Bilder/TIFF ist die Standardeinheit Pixel. Für PDF ist die Standardeinheit Zoll.

DocumentContentSegment

Objekt

Erkanntes Dokumenteninhaltssegment.

Name	Typ	Beschreibung
category	string	Kategorie Klassifizierter Inhalt.
endPageNumber	integer (int32)	Endseitennummer (1-indexiert) des Segments.
segmentId	string	Segmentbezeichner
span	ContentSpan	Spannweite des Segments im Markdown-Inhalt.
startPageNumber	integer (int32)	Startseitennummer (1-indexiert) des Segments.

DocumentFootnote

Objekt

Fußnote einer Tabelle oder Figur.

Name	Typ	Beschreibung
content	string	Inhalt der Fußnote.
elements	string[]	Kindliche Elemente der Fußnote.
source	string	Codierte Quelle, die die Position der Fußnote im Inhalt identifiziert.
span	ContentSpan	Spannweite der Fußnote im Markdown-Inhalt.

DocumentFormula

Objekt

Mathematische Formel in einem Dokument.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Vertrauen bei der Vorhersage der Formel.
kind	DocumentFormulaKind	Formeltyp.
source	string	Codierte Quelle, die die Position der Formel im Inhalt identifiziert.
span	ContentSpan	Spannweite der Formel im Inhalt des Markdowns.
value	string	LaTex-Ausdruck, der die Formel beschreibt.

DocumentFormulaKind

Enumeration

Formeltyp.

Wert	Beschreibung
inline	Eine Formel, die im Inhalt eines Absatzes eingebettet ist.
display	Eine Formel im Display-Modus, die eine ganze Reihe einnimmt.

DocumentHyperlink

Objekt

Hyperlink in einem Dokument, zum Beispiel ein Link zu einer Webseite oder einer E-Mail-Adresse.

Name	Typ	Beschreibung
content	string	Verlinkte Inhalte.
source	string	Position des Links.
span	ContentSpan	Umfang des Links im Markdown-Inhalt.
url	string	URL des Hyperlinks.

DocumentLine

Objekt

Zeile in einem Dokument, bestehend aus einer zusammenhängenden Wortfolge.

Name	Typ	Beschreibung
content	string	Zeilentext.
source	string	Codierte Quelle, die die Position der Zeile im Inhalt angibt.
span	ContentSpan	Die Länge der Linie im Markdown-Inhalt.

DocumentMermaidFigure

Objekt

Abbildung mit einem Diagramm, wie einem Flussdiagramm oder Netzwerkdiagramm.

Name	Typ	Standardwert	Beschreibung
caption	DocumentCaption		Bildunterschrift.
content	string		Diagramminhalt wird mit Meerjungfrauensyntax dargestellt.
description	string		Beschreibung der Figur.
elements	string[]		Untergeordnete Elemente der Abbildung, mit Ausnahme von Beschriftungen oder Fußnoten.
footnotes	DocumentFootnote[]		Liste der Fußnoten der Figur.
id	string		Figurenkennung.
kind	string: mermaid	unknown	Finde ich das Gefühl.
role	SemanticRole		Semantische Rolle der Figur.
source	string		Codierte Quelle, die die Position der Abbildung im Inhalt angibt.
span	ContentSpan		Spannweite der Figur im Markdown-Inhalt.

DocumentPage

Objekt

Inhalt von einer Dokumentseite.

Name	Typ	Beschreibung
angle	number (float) maximum: 180	Die allgemeine Ausrichtung des Inhalts im Uhrzeigersinn, gemessen in Grad zwischen (-180, 180]. Nur wenn enableOcr wahr ist.
barcodes	DocumentBarcode[]	Liste der Barcodes auf der Seite. Nur wenn enableBarcode und returnDetails stimmen.
formulas	DocumentFormula[]	Liste mathematischer Formeln auf der Seite. Nur wenn enableFormula und returnDetails wahr sind.
height	number (float)	Höhe der Seite.
lines	DocumentLine[]	Liste der Zeilen auf der Seite. Nur wenn enableOcr und returnDetails wahr sind.
pageNumber	integer (int32) minimum: 1	Seitenzahl (1-basiert).
spans	ContentSpan[]	Spannweite(n), die der Seite im Markdown-Inhalt zugeordnet sind.
width	number (float)	Breite der Seite.
words	DocumentWord[]	Liste der Wörter auf der Seite. Nur wenn enableOcr und returnDetails wahr sind.

DocumentParagraph

Objekt

Absatz in einem Dokument, der in der Regel aus einer zusammenhängenden Zeilenfolge mit gemeinsamer Ausrichtung und Abstand besteht.

Name	Typ	Beschreibung
content	string	Absatztext.
role	SemanticRole	Semantische Rolle des Absatzes.
source	string	Kodierte Quelle, die die Position des Absatzes im Inhalt angibt.
span	ContentSpan	Umfang des Absatzes im Markdown-Inhalt.

DocumentSection

Objekt

Abschnitt in einem Dokument.

Name	Typ	Beschreibung
elements	string[]	Untergeordnete Elemente des Abschnitts.
span	ContentSpan	Umfang des Abschnitts im Markdown-Inhalt.

DocumentTable

Objekt

Tabelle in einem Dokument, bestehend aus Tabellenzellen, die in einem rechteckigen Layout angeordnet sind.

Name	Typ	Beschreibung
caption	DocumentCaption	Tischbildunterschrift.
cells	DocumentTableCell[]	Zellen, die in der Tabelle enthalten sind.
columnCount	integer (int32) minimum: 1	Anzahl der Spalten in der Tabelle.
footnotes	DocumentFootnote[]	Liste der Tisch-Fußnoten.
role	SemanticRole	Semantische Rolle des Tisches.
rowCount	integer (int32) minimum: 1	Anzahl der Zeilen in der Tabelle.
source	string	Codierte Quelle, die die Position der Tabelle im Inhalt identifiziert.
span	ContentSpan	Spannweite der Tabelle im Inhalt des Markdowns.

DocumentTableCell

Objekt

Tabellenzelle in einer Dokumententabelle.

Name	Typ	Standardwert	Beschreibung
columnIndex	integer (int32)		Spaltenindex der Zelle.
columnSpan	integer (int32) minimum: 1	1	Die Anzahl der Spalten, die von dieser Zelle überspannt sind.
content	string		Inhalt der Tabellenzelle.
elements	string[]		Kindelemente der Tabellenzelle.
kind	DocumentTableCellKind	content	Tabellenzellentyp.
rowIndex	integer (int32)		Zeilenindex der Zelle.
rowSpan	integer (int32) minimum: 1	1	Die Anzahl der Zeilen, die von dieser Zelle überspannt sind.
source	string		Codierte Quelle, die die Position der Tabellenzelle im Inhalt identifiziert.
span	ContentSpan		Spannweite der Tabellenzelle im Markdown-Inhalt.

DocumentTableCellKind

Enumeration

Tabellenzellentyp.

Wert	Beschreibung
content	Hauptinhalt/Daten.
rowHeader	Beschreibung des Inhalts der Zeile.
columnHeader	Beschreibe den Inhalt der Spalte.
stubHead	Beschreibung der Zeilenüberschriften, die sich üblicherweise oben links in einer Tabelle befinden.
description	Beschreibung des Inhalts in (Teilen von) der Tabelle.

DocumentWord

Objekt

Wort in einem Dokument, bestehend aus einer zusammenhängenden Zeichenfolge. Bei nicht leerzeichentrennten Sprachen, z. B. Chinesisch, Japanisch und Koreanisch, wird jedes Zeichen als eigenes Wort dargestellt.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Selbstvertrauen, das Wort vorherzusagen.
content	string	Worttext.
source	string	Codierte Quelle, die die Position des Wortes im Inhalt identifiziert.
span	ContentSpan	Umfang des Wortes im Markdown-Inhalt.

IntegerField

Objekt

Ganzzahlfeld aus dem Inhalt extrahiert.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Zuversicht bei der Vorhersage des Feldwerts.
source	string	Codierte Quelle, die die Position des Feldwerts im Inhalt identifiziert.
spans	ContentSpan[]	Span(s), die mit dem Feldwert im Markdown-Inhalt verknüpft sind.
type	string: integer	Semantischer Datentyp des Feldwerts.
valueInteger	integer (int64)	Ganzzahliger Feldwert.

JsonField

Objekt

JSON-Feld aus dem Inhalt extrahiert.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Zuversicht bei der Vorhersage des Feldwerts.
source	string	Codierte Quelle, die die Position des Feldwerts im Inhalt identifiziert.
spans	ContentSpan[]	Span(s), die mit dem Feldwert im Markdown-Inhalt verknüpft sind.
type	string: json	Semantischer Datentyp des Feldwerts.
valueJson		JSON-Feldwert.

LengthUnit

Enumeration

Längeneinheit, die durch Breite-, Höhen- und Quelleigenschaften verwendet wird.

Wert	Beschreibung
pixel	Pixel-Einheit.
inch	Zoll-Einheit.

NumberField

Objekt

Zahlenfeld aus dem Inhalt extrahiert.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Zuversicht bei der Vorhersage des Feldwerts.
source	string	Codierte Quelle, die die Position des Feldwerts im Inhalt identifiziert.
spans	ContentSpan[]	Span(s), die mit dem Feldwert im Markdown-Inhalt verknüpft sind.
type	string: number	Semantischer Datentyp des Feldwerts.
valueNumber	number (double)	Zahlenfeldwert.

ObjectField

Objekt

Objektfeld aus dem Inhalt extrahiert.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Zuversicht bei der Vorhersage des Feldwerts.
source	string	Codierte Quelle, die die Position des Feldwerts im Inhalt identifiziert.
spans	ContentSpan[]	Span(s), die mit dem Feldwert im Markdown-Inhalt verknüpft sind.
type	string: object	Semantischer Datentyp des Feldwerts.
valueObject	object	Objektfeldwert.

OperationState

Enumeration

den Status des Vorgangs

Wert	Beschreibung
NotStarted	Der Vorgang wurde noch nicht gestartet.
Running	Der Vorgang wird ausgeführt.
Succeeded	Der Vorgang wurde erfolgreich abgeschlossen.
Failed	Fehler beim Vorgang.
Canceled	Der Vorgang wurde vom Benutzer abgebrochen.

ProcessingLocation

Enumeration

Der Ort, an dem die Daten verarbeitet werden können. Standardmäßig steht es auf global.

Wert	Beschreibung
geography	Daten können in derselben Geografie wie die Ressource verarbeitet werden.
dataZone	Daten können in derselben Datenzone wie die Ressource verarbeitet werden.
global	Daten können in jedem Azure-Rechenzentrum weltweit verarbeitet werden.

SemanticRole

Enumeration

Semantische Rolle des Absatzes.

Wert	Beschreibung
pageHeader	Text am oberen Rand der Seite.
pageFooter	Text am unteren Rand der Seite.
pageNumber	Seitennummer.
title	Top-Level-Titel, der das gesamte Dokument beschreibt.
sectionHeading	Unterüberschrift, die einen Abschnitt des Dokuments beschreibt.
footnote	Die Notiz wird üblicherweise nach dem Hauptinhalt auf einer Seite platziert.
formulaBlock	Block von Formeln, oft mit gemeinsamer Ausrichtung.

StringField

Objekt

String-Feld aus dem Inhalt extrahiert.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Zuversicht bei der Vorhersage des Feldwerts.
source	string	Codierte Quelle, die die Position des Feldwerts im Inhalt identifiziert.
spans	ContentSpan[]	Span(s), die mit dem Feldwert im Markdown-Inhalt verknüpft sind.
type	string: string	Semantischer Datentyp des Feldwerts.
valueString	string	Zeichenkettenfeldwert.

TimeField

Objekt

Zeitfeld aus dem Inhalt extrahiert.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Zuversicht bei der Vorhersage des Feldwerts.
source	string	Codierte Quelle, die die Position des Feldwerts im Inhalt identifiziert.
spans	ContentSpan[]	Span(s), die mit dem Feldwert im Markdown-Inhalt verknüpft sind.
type	string: time	Semantischer Datentyp des Feldwerts.
valueTime	string (time)	Zeitfeldwert im ISO 8601 (hh:mm:ss) Format.

TranscriptPhrase

Objekt

Transkriptphrase.

Name	Typ	Beschreibung
confidence	number (float) minimum: 0 maximum: 1	Selbstvertrauen bei der Vorhersage der Phrase.
endTimeMs	integer (int64)	Endzeit der Phrase in Millisekunden.
locale	string	Ort des Satzes erkannt. Zum Beispiel en-US.
span	ContentSpan	Spannweite des Satzes im Markdown-Inhalt.
speaker	string	Sprecherindex oder Name.
startTimeMs	integer (int64)	Startzeit der Phrase in Millisekunden.
text	string	Text des Transkripts.
words	TranscriptWord[]	Liste der Wörter in der Phrase.

TranscriptWord

Objekt

Transkript Wort.

Name	Typ	Beschreibung
endTimeMs	integer (int64)	Endzeit des Wortes in Millisekunden.
span	ContentSpan	Umfang des Wortes im Markdown-Inhalt.
startTimeMs	integer (int64)	Startzeit des Wortes in Millisekunden.
text	string	Text des Transkripts.

UsageDetails

Objekt

Nutzungsdetails.

Name	Typ	Beschreibung
audioHours	number (float)	Die Stunden an Audio wurden verarbeitet.
contextualizationTokens	integer (int32)	Die Anzahl der Kontextualisierungstoken, die zur Kontextvorbereitung, zur Erzeugung von Konfidenzwerten, Quellfundierung und Ausgabeformatierung verbraucht werden.
documentPagesBasic	integer (int32)	Die Anzahl der Dokumentseiten, die auf der Grundebene verarbeitet werden. Für Dokumente ohne explizite Seiten (ex. txt, HTML) werden alle 3000 UTF-16-Zeichen als eine Seite gezählt.
documentPagesMinimal	integer (int32)	Die Anzahl der Dokumentseiten, die auf minimaler Ebene verarbeitet werden. Für Dokumente ohne explizite Seiten (ex. txt, HTML) werden alle 3000 UTF-16-Zeichen als eine Seite gezählt.
documentPagesStandard	integer (int32)	Die Anzahl der auf Standardebene verarbeiteten Dokumentseiten. Für Dokumente ohne explizite Seiten (ex. txt, HTML) werden alle 3000 UTF-16-Zeichen als eine Seite gezählt.
tokens	object	Die Anzahl der verbrauchten LLM- und Embedding-Tokens, gruppiert nach Modell (z. B. GTP 4.1) und Typ (z. B. Eingabe, zwischengespeicherte Eingabe, Ausgabe).
videoHours	number (float)	Die Stunden an Video, die verarbeitet wurden.

Freigeben über

Content Analyzers - Analyze Binary

URI-Parameter

Anforderungsheader

Anforderungstext

Antworten

Sicherheit

Ocp-Apim-Subscription-Key

EntraIdToken

Bereiche

Beispiele

Analyze File

Beispielanforderung

Beispiel für eine Antwort

Definitionen

AnalysisContentKind

AnalysisResult

ArrayField

AudioVisualContent

AudioVisualContentSegment

Azure.Core.Foundations.Error

Azure.Core.Foundations.ErrorResponse

Azure.Core.Foundations.InnerError

BooleanField

ContentAnalyzerAnalyzeOperationStatus

ContentFieldType

ContentSpan

DateField

DocumentAnnotation

DocumentAnnotationComment

DocumentAnnotationKind

DocumentBarcode

DocumentBarcodeKind

DocumentCaption

DocumentChartFigure

DocumentContent

DocumentContentSegment

DocumentFootnote

DocumentFormula

DocumentFormulaKind

DocumentHyperlink

DocumentLine

DocumentMermaidFigure

DocumentPage

DocumentParagraph

DocumentSection

DocumentTable

DocumentTableCell

DocumentTableCellKind

DocumentWord

IntegerField

JsonField

LengthUnit

NumberField

ObjectField

OperationState

ProcessingLocation

SemanticRole

StringField

TimeField

TranscriptPhrase

TranscriptWord

UsageDetails