Sdílet prostřednictvím


FormPage Třída

Představuje stránku rozpoznanou ze vstupního dokumentu. Obsahuje řádky, slova, značky výběru, tabulky a metadata stránek.

Novinka ve verzi v2.1: selection_marks vlastnost, podpora metod to_dict a from_dict

Dědičnost
builtins.object
FormPage

Konstruktor

FormPage(**kwargs: Any)

Metody

from_dict

Převede diktát ve tvaru FormPage na samotný model.

to_dict

Vrátí reprezentaci diktu FormPage.

from_dict

Převede diktát ve tvaru FormPage na samotný model.

from_dict(data: Dict) -> FormPage

Parametry

data
dict
Vyžadováno

Slovník ve tvaru FormPage.

Návraty

FormPage

Návratový typ

to_dict

Vrátí reprezentaci diktu FormPage.

to_dict() -> Dict

Návraty

dict

Návratový typ

Atributy

height

Výška obrázku nebo PDF v pixelech nebo palcích

height: float

lines

Pokud je include_field_elements nastavena na hodnotu true, vrátí se seznam rozpoznaných řádků textu. Pro volání k rozpoznávání obsahu se tento seznam vždy vyplní. Maximální počet vrácených řádků je 300 na stránku. Čáry jsou seřazené shora dolů, zleva doprava, i když v některých případech je vzdálenost považována za vyšší prioritu. Vzhledem k tomu, že pořadí řazení závisí na zjištěném textu, může se měnit napříč obrázky a aktualizacemi verzí OCR. Obchodní logika by proto měla být založena na skutečném umístění řádku místo na pořadí. Pořadí čtení řádků může být určeno argumentem klíčového slova reading_order (Poznámka: reading_order podporováno pouze v begin_recognize_content a begin_recognize_content_from_url).

lines: List[FormLine]

page_number

1 číslo stránky, na které je tento obsah.

page_number: int

selection_marks

Seznam značek výběru extrahovaných ze stránky

selection_marks: List[FormSelectionMark]

tables

Seznam extrahovaných tabulek obsažených na stránce.

tables: List[FormTable]

text_angle

Obecná orientace textu ve směru po směru hodinových ručiček měřená ve stupních mezi (-180, 180).

text_angle: float

unit

Používá LengthUnit se vlastnostmi šířky, výšky a ohraničujícího rámečku. U obrázků je to "pixel". Pro PDF je jednotka "inch".

unit: str

width

Šířka obrázku nebo PDF v pixelech/palcích.

width: float