Document Classifiers - Get Classify Result
Obtient le résultat du classifieur de documents.
GET {endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-02-29-preview
Paramètres URI
Nom | Dans | Obligatoire | Type | Description |
---|---|---|---|---|
classifier
|
path | True |
string |
Nom du classifieur de document unique. Modèle d’expression régulière: |
endpoint
|
path | True |
string |
Point de terminaison du service Document Intelligence. |
result
|
path | True |
string uuid |
Analyser l’ID de résultat de l’opération. |
api-version
|
query | True |
string |
Version de l’API à utiliser pour cette opération. |
Réponses
Nom | Type | Description |
---|---|---|
200 OK |
La demande a réussi. |
|
Other Status Codes |
Réponse d’erreur inattendue. |
Sécurité
Ocp-Apim-Subscription-Key
Type:
apiKey
Dans:
header
OAuth2Auth
Type:
oauth2
Flux:
accessCode
URL d’autorisation:
https://login.microsoftonline.com/common/oauth2/authorize
URL du jeton:
https://login.microsoftonline.com/common/oauth2/token
Étendues
Nom | Description |
---|---|
https://cognitiveservices.azure.com/.default |
Exemples
Get Classify Document Result
Exemple de requête
GET https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/myClassifier/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-02-29-preview
Exemple de réponse
{
"status": "succeeded",
"createdDateTime": "2021-09-24T13:00:46Z",
"lastUpdatedDateTime": "2021-09-24T13:00:49Z",
"analyzeResult": {
"apiVersion": "2024-02-29-preview",
"modelId": "myClassifier",
"stringIndexType": "textElements",
"contentFormat": "text",
"content": "",
"pages": [
{
"pageNumber": 1,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 2,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 3,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
}
],
"documents": [
{
"docType": "formA",
"boundingRegions": [
{
"pageNumber": 1,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
},
{
"pageNumber": 2,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
},
{
"docType": "formB",
"boundingRegions": [
{
"pageNumber": 3,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
}
]
}
}
Définitions
Nom | Description |
---|---|
Address |
Valeur du champ d’adresse. |
Analyze |
Résultat de l’analyse du document. |
Analyze |
État et résultat de l’opération d’analyse. |
Bounding |
Polygone englobant sur une page spécifique de l’entrée. |
Content |
Format du contenu dans le résultat analysé. |
Currency |
Valeur du champ Devise. |
Document |
Objet décrivant l’emplacement et le contenu sémantique d’un document. |
Document |
Objet de code-barres. |
Document |
Type de code-barres. |
Document |
Objet légende décrivant une table ou une figure. |
Document |
Objet représentant le contenu et l’emplacement d’une valeur de champ. |
Document |
Type de données sémantique de la valeur de champ. |
Document |
Objet représentant une figure dans le document. |
Document |
Objet de note de bas de page décrivant une table ou une figure. |
Document |
Objet de formule. |
Document |
Type de formule. |
Document |
Objet représentant la clé ou la valeur de champ dans une paire clé-valeur. |
Document |
Objet représentant un champ de formulaire avec une étiquette de champ distincte (clé) et une valeur de champ (peut être vide). |
Document |
Objet représentant la langue détectée pour une étendue de texte donnée. |
Document |
Objet de ligne de contenu constitué d’une séquence adjacente d’éléments de contenu, tels que des mots et des marques de sélection. |
Document |
Objet représentant une liste dans le document. |
Document |
Objet représentant un élément de liste dans le document. |
Document |
Éléments de contenu et de disposition extraits d’une page de l’entrée. |
Document |
Objet de paragraphe composé de lignes contiguës avec généralement un alignement et un espacement communs. |
Document |
Objet représentant une section dans le document. |
Document |
Objet de marque de sélection représentant case activée zones, cases d’option et autres éléments indiquant une sélection. |
Document |
État de la marque de sélection. |
Document |
Présence de signature. |
Document |
Zone contiguë de la propriété de contenu concaténé, spécifiée en tant que décalage et longueur. |
Document |
Objet représentant les styles de texte observés. |
Document |
Objet table constitué de cellules de tableau organisées dans une disposition rectangulaire. |
Document |
Objet représentant l’emplacement et le contenu d’une cellule de tableau. |
Document |
Type de cellule de tableau. |
Document |
Objet word constitué d’une séquence contiguë de caractères. Pour les langues non délimitées par l’espace, telles que le chinois, le japonais et le coréen, chaque caractère est représenté comme son propre mot. |
Error |
Objet d’erreur. |
Error |
Objet de réponse d’erreur. |
Font |
Style de police. |
Font |
Épaisseur de police. |
Inner |
Objet contenant des informations plus spécifiques sur l’erreur. |
Length |
Unité utilisée par les propriétés width, height et polygone. Pour les images, l’unité est « pixel ». Pour PDF, l’unité est « pouce ». |
Operation |
État de l’opération. |
Paragraph |
Rôle sémantique du paragraphe. |
String |
Méthode utilisée pour calculer le décalage et la longueur de chaîne. |
AddressValue
Valeur du champ d’adresse.
Nom | Type | Description |
---|---|---|
city |
string |
Nom de la ville, de la ville, du village, etc. |
cityDistrict |
string |
Des districts ou des arrondissements au sein d’une ville, comme Brooklyn à New York ou La ville de Westminster à Londres. |
countryRegion |
string |
Pays/Région. |
house |
string |
Nom de build, par exemple World Trade Center. |
houseNumber |
string |
Numéro de la maison ou de l’immeuble. |
level |
string |
Numéro d’étage, par exemple 3F. |
poBox |
string |
Numéro de la boîte postale. |
postalCode |
string |
Code postal utilisé pour le tri du courrier. |
road |
string |
Nom de la rue. |
state |
string |
Division administrative de premier niveau. |
stateDistrict |
string |
Division administrative de second niveau utilisée dans certains paramètres régionaux. |
streetAddress |
string |
Adresse au niveau de la rue, à l’exclusion de la ville, de l’état, du paysRégion et du code postal. |
suburb |
string |
Nom de quartier non officiel, comme Chinatown. |
unit |
string |
Numéro d’appartement ou de bureau |
AnalyzeResult
Résultat de l’analyse du document.
Nom | Type | Description |
---|---|---|
apiVersion |
string |
Version de l’API utilisée pour produire ce résultat. |
content |
string |
Représentation sous forme de chaîne de concaténation de tous les éléments textuels et visuels dans l’ordre de lecture. |
contentFormat |
Format du contenu de niveau supérieur de l’analyse des résultats. |
|
documents |
Document[] |
Documents extraits. |
figures |
Figures extraites. |
|
keyValuePairs |
Paires clé-valeur extraites. |
|
languages |
Langues détectées. |
|
lists |
Listes extraites. |
|
modelId |
string |
ID de modèle de document utilisé pour produire ce résultat. |
pages |
Pages analysées. |
|
paragraphs |
Paragraphes extraits. |
|
sections |
Sections extraites. |
|
stringIndexType |
Méthode utilisée pour calculer le décalage et la longueur de chaîne. |
|
styles |
Styles de police extraits. |
|
tables |
Tables extraites. |
AnalyzeResultOperation
État et résultat de l’opération d’analyse.
Nom | Type | Description |
---|---|---|
analyzeResult |
Résultat de l’analyse du document. |
|
createdDateTime |
string |
Date et heure (UTC) auxquelles l’opération d’analyse a été envoyée. |
error |
Erreur rencontrée lors de l’analyse du document. |
|
lastUpdatedDateTime |
string |
Date et heure (UTC) de la dernière mise à jour du status. |
status |
État de l’opération. notDémarré, en cours d’exécution, réussi ou ayant échoué |
BoundingRegion
Polygone englobant sur une page spécifique de l’entrée.
Nom | Type | Description |
---|---|---|
pageNumber |
integer |
Numéro de page basé sur 1 contenant la région englobante. |
polygon |
number[] |
Polygone englobant sur la page, ou la page entière s’il n’est pas spécifié. Coordonnées spécifiées par rapport au haut à gauche de la page. Les nombres représentent les valeurs x, y des sommets de polygones, dans le sens des aiguilles d’une montre à partir de la gauche (-180 degrés inclus) par rapport à l’orientation de l’élément. |
ContentFormat
Format du contenu dans le résultat analysé.
Nom | Type | Description |
---|---|---|
markdown |
string |
Représentation Markdown du contenu du document avec des en-têtes de section, des tables, etc. |
text |
string |
Représentation en texte brut du contenu du document sans aucune mise en forme. |
CurrencyValue
Valeur du champ Devise.
Nom | Type | Description |
---|---|---|
amount |
number |
Montant monétaire. |
currencyCode |
string |
Code monétaire résolu (ISO 4217), le cas échéant. |
currencySymbol |
string |
Étiquette de symbole monétaire, le cas échéant. |
Document
Objet décrivant l’emplacement et le contenu sémantique d’un document.
Nom | Type | Description |
---|---|---|
boundingRegions |
Régions englobantes couvrant le document. |
|
confidence |
number |
Confiance de l’extraction correcte du document. |
docType |
string |
Type de document. |
fields |
<string,
Document |
Dictionnaire de valeurs de champ nommées. |
spans |
Emplacement du document dans le contenu concaténé dans l’ordre de lecture. |
DocumentBarcode
Objet de code-barres.
Nom | Type | Description |
---|---|---|
confidence |
number |
Confiance de l’extraction correcte du code-barres. |
kind |
Type de code-barres. |
|
polygon |
number[] |
Polygone englobant du code-barres, avec des coordonnées spécifiées par rapport à la partie supérieure gauche de la page. Les nombres représentent les valeurs x, y des sommets de polygones, dans le sens des aiguilles d’une montre à partir de la gauche (-180 degrés inclus) par rapport à l’orientation de l’élément. |
span |
Emplacement du code-barres dans le contenu concaténé dans l’ordre de lecture. |
|
value |
string |
Valeur de code-barres. |
DocumentBarcodeKind
Type de code-barres.
Nom | Type | Description |
---|---|---|
Aztec |
string |
Code aztèque, tel que défini dans ISO/IEC 24778 :2008. |
Codabar |
string |
Code-barres Codabar, tel que défini dans ANSI/AIM BC3-1995. |
Code128 |
string |
Code-barres 128, tel que défini dans ISO/IEC 15417 :2007. |
Code39 |
string |
Code 39 code-barres, tel que défini dans ISO/IEC 16388 :2007. |
Code93 |
string |
Code 93 code-barres, tel que défini dans ANSI/AIM BC5-1995. |
DataBar |
string |
Code-barres DataBar GS1. |
DataBarExpanded |
string |
Code-barres étendu DataBar GS1. |
DataMatrix |
string |
Code de matrice de données, tel que défini dans ISO/IEC 16022 :2006. |
EAN13 |
string |
GS1 numéro d’article international à 13 chiffres (numéro d’article européen). |
EAN8 |
string |
Numéro d’article international gS1 à 8 chiffres (numéro d’article européen). |
ITF |
string |
Code-barres entrelacé 2 sur 5, tel que défini dans ANSI/AIM BC2-1995. |
MaxiCode |
string |
MaxiCode, tel que défini dans ISO/IEC 16023 :2000. |
MicroQRCode |
string |
Micro code QR, tel que défini dans ISO/IEC 23941 :2022. |
PDF417 |
string |
PDF417, tel que défini dans ISO 15438. |
QRCode |
string |
Code QR, tel que défini dans ISO/IEC 18004 :2015. |
UPCA |
string |
Code de produit universel GS1 à 12 chiffres. |
UPCE |
string |
Code de produit universel à 6 chiffres GS1. |
DocumentCaption
Objet légende décrivant une table ou une figure.
Nom | Type | Description |
---|---|---|
boundingRegions |
Régions englobantes couvrant le légende. |
|
content |
string |
Contenu du légende. |
elements |
string[] |
Éléments enfants du légende. |
spans |
Emplacement du légende dans le contenu concaténé dans l’ordre de lecture. |
DocumentField
Objet représentant le contenu et l’emplacement d’une valeur de champ.
Nom | Type | Description |
---|---|---|
boundingRegions |
Régions englobantes couvrant le champ. |
|
confidence |
number |
Confiance de l’extraction correcte du champ. |
content |
string |
Contenu du champ. |
spans |
Emplacement du champ dans le contenu concaténé dans l’ordre de lecture. |
|
type |
Type de données de la valeur de champ. |
|
valueAddress |
Valeur d’adresse. |
|
valueArray |
Tableau de valeurs de champ. |
|
valueBoolean |
boolean |
Valeur booléenne. |
valueCountryRegion |
string |
Valeur de code pays à 3 lettres (ISO 3166-1 alpha-3). |
valueCurrency |
Valeur monétaire. |
|
valueDate |
string |
Valeur de date au format AAAA-MM-JJ (ISO 8601). |
valueInteger |
integer |
Valeur de type entier. |
valueNumber |
number |
Valeur à virgule flottante. |
valueObject |
<string,
Document |
Dictionnaire de valeurs de champ nommées. |
valuePhoneNumber |
string |
Valeur de numéro de téléphone au format E.164 (par exemple, +19876543210). |
valueSelectionGroup |
string[] |
Valeur du groupe de sélection. |
valueSelectionMark |
Valeur de la marque de sélection. |
|
valueSignature |
Présence de signature. |
|
valueString |
string |
Valeur de chaîne. |
valueTime |
string |
Valeur de temps au format hh :mm :ss (ISO 8601). |
DocumentFieldType
Type de données sémantique de la valeur de champ.
Nom | Type | Description |
---|---|---|
address |
string |
Adresse analysée. |
array |
string |
Liste des sous-champs du même type. |
boolean |
string |
Valeur booléenne, normalisée sur true ou false. |
countryRegion |
string |
Pays/région, normalisé au format ISO 3166-1 alpha-3 (par exemple, États-Unis). |
currency |
string |
Montant monétaire avec symbole et unité de devise facultatifs. |
date |
string |
Date, normalisée au format ISO 8601 (AAAA-MM-JJ). |
integer |
string |
Nombre entier normalisé en entier signé 64 bits. |
number |
string |
Nombre à virgule flottante, normalisé en virgule flottante double précision. |
object |
string |
Liste nommée de sous-champs de types potentiellement différents. |
phoneNumber |
string |
Numéro de téléphone, normalisé au format E.164 (+{CountryCode}{SubscriberNumber}). |
selectionGroup |
string |
Tableau des valeurs de chaîne sélectionnées. |
selectionMark |
string |
Le champ est-il sélectionné ? |
signature |
string |
La signature est-elle présente ? |
string |
string |
Texte brut. |
time |
string |
Heure normalisée au format ISO 8601 (hh :mm :ss). |
DocumentFigure
Objet représentant une figure dans le document.
Nom | Type | Description |
---|---|---|
boundingRegions |
Régions englobantes couvrant la figure. |
|
caption |
Légende associée à la figure. |
|
elements |
string[] |
Éléments enfants de la figure, à l’exclusion des légende ou notes de bas de page. |
footnotes |
Liste des notes de bas de page associées à la figure. |
|
spans |
Emplacement de la figure dans le contenu concaténé de l’ordre de lecture. |
DocumentFootnote
Objet de note de bas de page décrivant une table ou une figure.
Nom | Type | Description |
---|---|---|
boundingRegions |
Régions englobantes couvrant la note de bas de page. |
|
content |
string |
Contenu de la note de bas de page. |
elements |
string[] |
Éléments enfants de la note de bas de page. |
spans |
Emplacement de la note de bas de page dans le contenu concaténé dans l’ordre de lecture. |
DocumentFormula
Objet de formule.
Nom | Type | Description |
---|---|---|
confidence |
number |
Confiance de l’extraction correcte de la formule. |
kind |
Type de formule. |
|
polygon |
number[] |
Polygone englobant de la formule, avec des coordonnées spécifiées par rapport à la partie supérieure gauche de la page. Les nombres représentent les valeurs x, y des sommets de polygones, dans le sens des aiguilles d’une montre à partir de la gauche (-180 degrés inclus) par rapport à l’orientation de l’élément. |
span |
Emplacement de la formule dans le contenu concaténé dans l’ordre de lecture. |
|
value |
string |
Expression LaTex décrivant la formule. |
DocumentFormulaKind
Type de formule.
Nom | Type | Description |
---|---|---|
display |
string |
Formule en mode d’affichage qui occupe une ligne entière. |
inline |
string |
Formule incorporée dans le contenu d’un paragraphe. |
DocumentKeyValueElement
Objet représentant la clé ou la valeur de champ dans une paire clé-valeur.
Nom | Type | Description |
---|---|---|
boundingRegions |
Régions englobantes couvrant l’élément clé-valeur. |
|
content |
string |
Contenu concaténé de l’élément clé-valeur dans l’ordre de lecture. |
spans |
Emplacement de l’élément clé-valeur dans le contenu concaténé dans l’ordre de lecture. |
DocumentKeyValuePair
Objet représentant un champ de formulaire avec une étiquette de champ distincte (clé) et une valeur de champ (peut être vide).
Nom | Type | Description |
---|---|---|
confidence |
number |
Confiance de l’extraction correcte de la paire clé-valeur. |
key |
Étiquette de champ de la paire clé-valeur. |
|
value |
Valeur de champ de la paire clé-valeur. |
DocumentLanguage
Objet représentant la langue détectée pour une étendue de texte donnée.
Nom | Type | Description |
---|---|---|
confidence |
number |
Confiance d’identifier correctement la langue. |
locale |
string |
Langue détectée. La valeur peut être un code de langue ISO 639-1 (par exemple, « en », « fr ») ou une balise de langue BCP 47 (par exemple, « zh-Hans »). |
spans |
Emplacement des éléments de texte dans le contenu concaténé auquel la langue s’applique. |
DocumentLine
Objet de ligne de contenu constitué d’une séquence adjacente d’éléments de contenu, tels que des mots et des marques de sélection.
Nom | Type | Description |
---|---|---|
content |
string |
Contenu concaténé des éléments contenus dans l’ordre de lecture. |
polygon |
number[] |
Polygone englobant de la ligne, avec des coordonnées spécifiées par rapport à la partie supérieure gauche de la page. Les nombres représentent les valeurs x, y des sommets de polygones, dans le sens des aiguilles d’une montre à partir de la gauche (-180 degrés inclus) par rapport à l’orientation de l’élément. |
spans |
Emplacement de la ligne dans le contenu concaténé dans l’ordre de lecture. |
DocumentList
Objet représentant une liste dans le document.
Nom | Type | Description |
---|---|---|
items |
Éléments de la liste. |
|
spans |
Emplacement de la liste dans le contenu concaténé dans l’ordre de lecture. |
DocumentListItem
Objet représentant un élément de liste dans le document.
Nom | Type | Description |
---|---|---|
boundingRegions |
Régions englobantes couvrant l’élément de liste. |
|
content |
string |
Contenu de l’élément de liste. |
elements |
string[] |
Éléments enfants de l’élément de liste. |
level |
integer |
Niveau de l’élément de liste (indexé 1). |
spans |
Emplacement de l’élément de liste dans le contenu concaténé dans l’ordre de lecture. |
DocumentPage
Éléments de contenu et de disposition extraits d’une page de l’entrée.
Nom | Type | Description |
---|---|---|
angle |
number |
Orientation générale du contenu dans le sens des aiguilles d’une montre, mesurée en degrés compris entre (-180, 180). |
barcodes |
Codes-barres extraits de la page. |
|
formulas |
Formules extraites de la page. |
|
height |
number |
Hauteur de l’image/PDF en pixels/pouces, respectivement. |
lines |
Lignes extraites de la page, contenant potentiellement des éléments textuels et visuels. |
|
pageNumber |
integer |
Numéro de page basé sur 1 dans le document d’entrée. |
selectionMarks |
Marques de sélection extraites de la page. |
|
spans |
Emplacement de la page dans l’ordre de lecture du contenu concaténé. |
|
unit |
Unité utilisée par les propriétés largeur, hauteur et polygone. Pour les images, l’unité est « pixel ». Pour PDF, l’unité est « inch ». |
|
width |
number |
Largeur de l’image/PDF en pixels/pouces, respectivement. |
words |
Mots extraits de la page. |
DocumentParagraph
Objet de paragraphe composé de lignes contiguës avec généralement un alignement et un espacement communs.
Nom | Type | Description |
---|---|---|
boundingRegions |
Régions englobantes couvrant le paragraphe. |
|
content |
string |
Contenu concaténé du paragraphe dans l’ordre de lecture. |
role |
Rôle sémantique du paragraphe. |
|
spans |
Emplacement du paragraphe dans le contenu concaténé de l’ordre de lecture. |
DocumentSection
Objet représentant une section dans le document.
Nom | Type | Description |
---|---|---|
elements |
string[] |
Éléments enfants de la section. |
spans |
Emplacement de la section dans le contenu concaténé de l’ordre de lecture. |
DocumentSelectionMark
Objet de marque de sélection représentant case activée zones, cases d’option et autres éléments indiquant une sélection.
Nom | Type | Description |
---|---|---|
confidence |
number |
Confiance de l’extraction correcte de la marque de sélection. |
polygon |
number[] |
Polygone englobant de la marque de sélection, avec des coordonnées spécifiées par rapport à la partie supérieure gauche de la page. Les nombres représentent les valeurs x, y des sommets de polygones, dans le sens des aiguilles d’une montre à partir de la gauche (-180 degrés inclus) par rapport à l’orientation de l’élément. |
span |
Emplacement de la marque de sélection dans le contenu concaténé dans l’ordre de lecture. |
|
state |
État de la marque de sélection. |
DocumentSelectionMarkState
État de la marque de sélection.
Nom | Type | Description |
---|---|---|
selected |
string |
La marque de sélection est sélectionnée, souvent indiquée par un case activée ✓ ou une croix X à l’intérieur de la marque de sélection. |
unselected |
string |
La marque de sélection n’est pas sélectionnée. |
DocumentSignatureType
Présence de signature.
Nom | Type | Description |
---|---|---|
signed |
string |
Une signature est détectée. |
unsigned |
string |
Aucune signature n’est détectée. |
DocumentSpan
Zone contiguë de la propriété de contenu concaténé, spécifiée en tant que décalage et longueur.
Nom | Type | Description |
---|---|---|
length |
integer |
Nombre de caractères dans le contenu représenté par l’étendue. |
offset |
integer |
Index de base zéro du contenu représenté par l’étendue. |
DocumentStyle
Objet représentant les styles de texte observés.
Nom | Type | Description |
---|---|---|
backgroundColor |
string |
Couleur d’arrière-plan dans #rrggbb format hexadécimal. |
color |
string |
Couleur de premier plan dans #rrggbb format hexadécimal. |
confidence |
number |
Confiance d’identifier correctement le style. |
fontStyle |
Style de police. |
|
fontWeight |
Poids de police. |
|
isHandwritten |
boolean |
Le contenu est-il manuscrit ? |
similarFontFamily |
string |
Police visuellement la plus similaire parmi l’ensemble des familles de polices prises en charge, avec des polices de secours suivant la convention CSS (par exemple, « Arial, sans-serif »). |
spans |
Emplacement des éléments de texte dans le contenu concaténé auquel le style s’applique. |
DocumentTable
Objet table constitué de cellules de tableau organisées dans une disposition rectangulaire.
Nom | Type | Description |
---|---|---|
boundingRegions |
Régions englobantes couvrant la table. |
|
caption |
Légende associée à la table. |
|
cells |
Cellules contenues dans le tableau. |
|
columnCount |
integer |
Nombre de colonnes dans la table. |
footnotes |
Liste des notes de bas de page associées au tableau. |
|
rowCount |
integer |
Nombre de lignes dans la table. |
spans |
Emplacement de la table dans l’ordre de lecture du contenu concaténé. |
DocumentTableCell
Objet représentant l’emplacement et le contenu d’une cellule de tableau.
Nom | Type | Valeur par défaut | Description |
---|---|---|---|
boundingRegions |
Régions englobantes couvrant la cellule du tableau. |
||
columnIndex |
integer |
Index de colonne de la cellule. |
|
columnSpan |
integer |
1 |
Nombre de colonnes délimitées par cette cellule. |
content |
string |
Contenu concaténé de la cellule de tableau dans l’ordre de lecture. |
|
elements |
string[] |
Éléments enfants de la cellule de tableau. |
|
kind | content |
Type de cellule de tableau. |
|
rowIndex |
integer |
Index de ligne de la cellule. |
|
rowSpan |
integer |
1 |
Nombre de lignes délimitées par cette cellule. |
spans |
Emplacement de la cellule de tableau dans le contenu concaténé dans l’ordre de lecture. |
DocumentTableCellKind
Type de cellule de tableau.
Nom | Type | Description |
---|---|---|
columnHeader |
string |
Décrit le contenu de la colonne. |
content |
string |
Contient le contenu/les données main. |
description |
string |
Décrit le contenu dans (parties de) la table. |
rowHeader |
string |
Décrit le contenu de la ligne. |
stubHead |
string |
Décrit les en-têtes de ligne, généralement situés dans le coin supérieur gauche d’un tableau. |
DocumentWord
Objet word constitué d’une séquence contiguë de caractères. Pour les langues non délimitées par l’espace, telles que le chinois, le japonais et le coréen, chaque caractère est représenté comme son propre mot.
Nom | Type | Description |
---|---|---|
confidence |
number |
Confiance de l’extraction correcte du mot. |
content |
string |
Contenu textuel du mot. |
polygon |
number[] |
Polygone englobant du mot, avec des coordonnées spécifiées par rapport à la partie supérieure gauche de la page. Les nombres représentent les valeurs x, y des sommets de polygones, dans le sens des aiguilles d’une montre à partir de la gauche (-180 degrés inclus) par rapport à l’orientation de l’élément. |
span |
Emplacement du mot dans le contenu concaténé dans l’ordre de lecture. |
Error
Objet d’erreur.
Nom | Type | Description |
---|---|---|
code |
string |
Un des codes d’erreur définis par le serveur. |
details |
Error[] |
Tableau de détails sur les erreurs spécifiques qui ont conduit à cette erreur signalée. |
innererror |
Objet contenant des informations plus spécifiques que l’objet actuel sur l’erreur. |
|
message |
string |
Représentation lisible par l’homme de l’erreur. |
target |
string |
Cible de l’erreur. |
ErrorResponse
Objet de réponse d’erreur.
Nom | Type | Description |
---|---|---|
error |
Informations d’erreur. |
FontStyle
Style de police.
Nom | Type | Description |
---|---|---|
italic |
string |
Les caractères sont visuellement inclinés vers la droite. |
normal |
string |
Les caractères sont représentés normalement. |
FontWeight
Épaisseur de police.
Nom | Type | Description |
---|---|---|
bold |
string |
Les caractères sont représentés avec des traits plus épais. |
normal |
string |
Les caractères sont représentés normalement. |
InnerError
Objet contenant des informations plus spécifiques sur l’erreur.
Nom | Type | Description |
---|---|---|
code |
string |
Un des codes d’erreur définis par le serveur. |
innererror |
Erreur interne. |
|
message |
string |
Représentation lisible par l’homme de l’erreur. |
LengthUnit
Unité utilisée par les propriétés width, height et polygone. Pour les images, l’unité est « pixel ». Pour PDF, l’unité est « pouce ».
Nom | Type | Description |
---|---|---|
inch |
string |
Unité de longueur pour les fichiers PDF. |
pixel |
string |
Unité de longueur pour les fichiers image. |
OperationStatus
État de l’opération.
Nom | Type | Description |
---|---|---|
canceled |
string |
L’opération a été annulée. |
completed |
string |
L’opération est terminée. |
failed |
string |
L’opération a échoué. |
notStarted |
string |
L’opération n’a pas encore démarré. |
running |
string |
L’opération est en cours. |
succeeded |
string |
L'opération a réussi. |
ParagraphRole
Rôle sémantique du paragraphe.
Nom | Type | Description |
---|---|---|
footnote |
string |
Note généralement placée après le contenu main sur une page. |
formulaBlock |
string |
Bloc de formules, souvent avec alignement partagé. |
pageFooter |
string |
Texte près du bord inférieur de la page. |
pageHeader |
string |
Texte près du bord supérieur de la page. |
pageNumber |
string |
Nombre de page. |
sectionHeading |
string |
Sous-titre décrivant une section du document. |
title |
string |
Titre de niveau supérieur décrivant l’intégralité du document. |
StringIndexType
Méthode utilisée pour calculer le décalage et la longueur de chaîne.
Nom | Type | Description |
---|---|---|
textElements |
string |
Caractère d’affichage perçu par l’utilisateur, ou cluster graphème, tel que défini par Unicode 8.0.0. |
unicodeCodePoint |
string |
Unité de caractères représentée par un seul point de code Unicode. Utilisé par Python 3. |
utf16CodeUnit |
string |
Unité de caractères représentée par une unité de code Unicode 16 bits. Utilisé par JavaScript, Java et .NET. |