DocumentPage Klasse

Inhalts- und Layoutelemente, die aus einer Seite der Eingabe extrahiert wurden.

Neu in Version 2023-07-31: Die Eigenschaften Barcodes und Formeln .

Vererbung
builtins.object
DocumentPage

Konstruktor

DocumentPage(**kwargs: Any)

Methoden

from_dict

Konvertiert ein Diktat in der Form einer DocumentPage in das Modell selbst.

to_dict

Gibt eine Diktatdarstellung von DocumentPage zurück.

from_dict

Konvertiert ein Diktat in der Form einer DocumentPage in das Modell selbst.

from_dict(data: Dict) -> DocumentPage

Parameter

data
dict
Erforderlich

Ein Wörterbuch in der Form von DocumentPage.

Gibt zurück

Documentpage

Rückgabetyp

to_dict

Gibt eine Diktatdarstellung von DocumentPage zurück.

to_dict() -> Dict

Gibt zurück

dict

Rückgabetyp

Attribute

angle

Die allgemeine Ausrichtung des Inhalts im Uhrzeigersinn, gemessen in Grad zwischen (-180, 180).

angle: float | None

barcodes

Extrahierte Barcodes von der Seite.

barcodes: List[DocumentBarcode]

formulas

Extrahierte Formeln aus der Seite

formulas: List[DocumentFormula]

height

Die Höhe des Bilds/pdf in Pixel/Zoll.

height: float | None

lines

Extrahierte Zeilen aus der Seite, die möglicherweise sowohl Text- als auch visuelle Elemente enthalten.

lines: List[DocumentLine]

page_number

1-basierte Seitenzahl im Eingabedokument.

page_number: int

selection_marks

Extrahierte Auswahlmarkierungen von der Seite.

selection_marks: List[DocumentSelectionMark]

spans

Position der Seite in der Lesereihenfolge verketteten Inhalt.

spans: List[DocumentSpan]

unit

Die einheit, die von den Eigenschaften breite, höhe und umgebendes Polygon verwendet wird. Bei Bildern ist die Einheit "Pixel". Für PDF ist die Einheit "Zoll". Mögliche Werte sind: "pixel", "inch".

unit: str | None

width

Die Breite des Bilds/pdf in Pixel/Zoll.

width: float | None

words

Extrahierte Wörter aus der Seite.

words: List[DocumentWord]