Partager via


DocumentPage Classe

Éléments de contenu et de disposition extraits d’une page de l’entrée.

Nouveautés de la version 2023-07-31 : propriétés des codes-barres et des formules .

Héritage
builtins.object
DocumentPage

Constructeur

DocumentPage(**kwargs: Any)

Méthodes

from_dict

Convertit un dict dans la forme d’un DocumentPage en modèle lui-même.

to_dict

Retourne une représentation dictée de DocumentPage.

from_dict

Convertit un dict dans la forme d’un DocumentPage en modèle lui-même.

from_dict(data: Dict) -> DocumentPage

Paramètres

data
dict
Obligatoire

Dictionnaire au format DocumentPage.

Retours

DocumentPage

Type de retour

to_dict

Retourne une représentation dictée de DocumentPage.

to_dict() -> Dict

Retours

dict

Type de retour

Attributs

angle

Orientation générale du contenu dans le sens des aiguilles d’une montre, mesurée en degrés compris entre (-180, 180).

angle: float | None

barcodes

Codes-barres extraits de la page.

barcodes: List[DocumentBarcode]

formulas

Formules extraites de la page

formulas: List[DocumentFormula]

height

Hauteur de l’image/PDF en pixels/pouces, respectivement.

height: float | None

lines

Lignes extraites de la page, contenant potentiellement des éléments textuels et visuels.

lines: List[DocumentLine]

page_number

Numéro de page basé sur 1 dans le document d’entrée.

page_number: int

selection_marks

Marques de sélection extraites de la page.

selection_marks: List[DocumentSelectionMark]

spans

Emplacement de la page dans le contenu concaténé dans l’ordre de lecture.

spans: List[DocumentSpan]

unit

Unité utilisée par les propriétés de largeur, de hauteur et de polygone englobant. Pour les images, l’unité est « pixel ». Pour PDF, l’unité est « pouce ». Les valeurs possibles sont les suivantes : « pixel », « pouce ».

unit: str | None

width

Largeur de l’image/PDF en pixels/pouces, respectivement.

width: float | None

words

Mots extraits de la page.

words: List[DocumentWord]