Delen via


DocumentPage Klas

Inhouds- en indelingselementen geëxtraheerd uit een pagina van de invoer.

Nieuw in versie 2023-07-31: de eigenschappen van streepjescodes en formules .

Overname
builtins.object
DocumentPage

Constructor

DocumentPage(**kwargs: Any)

Methoden

from_dict

Converteert een dicteerfunctie in de vorm van een DocumentPage naar het model zelf.

to_dict

Retourneert een dictweergave van DocumentPage.

from_dict

Converteert een dicteerfunctie in de vorm van een DocumentPage naar het model zelf.

from_dict(data: Dict) -> DocumentPage

Parameters

data
dict
Vereist

Een woordenlijst in de vorm van DocumentPage.

Retouren

DocumentPage

Retourtype

to_dict

Retourneert een dictweergave van DocumentPage.

to_dict() -> Dict

Retouren

dict

Retourtype

Kenmerken

angle

De algemene richting van de inhoud met de klok mee, gemeten in graden tussen (-180, 180).

angle: float | None

barcodes

Streepjescodes geëxtraheerd van de pagina.

barcodes: List[DocumentBarcode]

formulas

Geëxtraheerde formules van de pagina

formulas: List[DocumentFormula]

height

De hoogte van de afbeelding/PDF in respectievelijk pixels/inch.

height: float | None

lines

Geëxtraheerde regels van de pagina, die mogelijk zowel tekstuele als visuele elementen bevatten.

lines: List[DocumentLine]

page_number

Paginanummer op basis van 1 in het invoerdocument.

page_number: int

selection_marks

Selectiemarkeringen geëxtraheerd van de pagina.

selection_marks: List[DocumentSelectionMark]

spans

Locatie van de pagina in de leesvolgorde samengevoegde inhoud.

spans: List[DocumentSpan]

unit

De eenheid die wordt gebruikt door de eigenschappen breedte, hoogte en begrenzing van veelhoeken. Voor afbeeldingen is de eenheid 'pixel'. Voor PDF is de eenheid "inch". Mogelijke waarden zijn: 'pixel', 'inch'.

unit: str | None

width

De breedte van de afbeelding/PDF in respectievelijk pixels/inch.

width: float | None

words

Geëxtraheerde woorden van de pagina.

words: List[DocumentWord]