Delen via


FormPage Klas

Vertegenwoordigt een pagina die wordt herkend uit het invoerdocument. Bevat regels, woorden, selectiemarkeringen, tabellen en metagegevens van pagina's.

Nieuw in versie v2.1: selection_marks eigenschap, ondersteuning voor to_dict - en from_dict methoden

Overname
builtins.object
FormPage

Constructor

FormPage(**kwargs: Any)

Methoden

from_dict

Converteert een dicteerfunctie in de vorm van een FormPage naar het model zelf.

to_dict

Retourneert een dict-weergave van FormPage.

from_dict

Converteert een dicteerfunctie in de vorm van een FormPage naar het model zelf.

from_dict(data: Dict) -> FormPage

Parameters

data
dict
Vereist

Een woordenlijst in de vorm van FormPage.

Retouren

FormPage

Retourtype

to_dict

Retourneert een dict-weergave van FormPage.

to_dict() -> Dict

Retouren

dict

Retourtype

Kenmerken

height

De hoogte van de afbeelding/PDF in respectievelijk pixels/inch.

height: float

lines

Wanneer include_field_elements is ingesteld op waar, wordt een lijst met herkende tekstregels geretourneerd. Voor aanroepen om inhoud te herkennen, wordt deze lijst altijd ingevuld. Het maximum aantal geretourneerde regels is 300 per pagina. De lijnen worden van boven naar beneden gesorteerd, van links naar rechts, hoewel in bepaalde gevallen nabijheid met een hogere prioriteit wordt behandeld. Omdat de sorteervolgorde afhankelijk is van de gedetecteerde tekst, kan deze veranderen tussen afbeeldingen en OCR-versie-updates. Bedrijfslogica moet dus worden gebaseerd op de werkelijke regellocatie in plaats van op volgorde. De leesvolgorde van regels kan worden opgegeven met het argument reading_order trefwoord (opmerking: reading_order alleen ondersteund in begin_recognize_content en begin_recognize_content_from_url).

lines: List[FormLine]

page_number

Het nummer op basis van 1 van de pagina waarop deze inhoud aanwezig is.

page_number: int

selection_marks

Lijst met selectiemarkeringen die zijn geëxtraheerd van de pagina.

selection_marks: List[FormSelectionMark]

tables

Een lijst met geëxtraheerde tabellen op een pagina.

tables: List[FormTable]

text_angle

De algemene richting van de tekst met de klok mee, gemeten in graden tussen (-180, 180).

text_angle: float

unit

De LengthUnit die wordt gebruikt door de eigenschappen voor breedte, hoogte en begrenzingsvak. Voor afbeeldingen is de eenheid 'pixel'. Voor PDF is de eenheid "inch".

unit: str

width

De breedte van de afbeelding/PDF in respectievelijk pixels/inch.

width: float