Udostępnij za pośrednictwem


FormPage Klasa

Reprezentuje stronę rozpoznaną z dokumentu wejściowego. Zawiera wiersze, wyrazy, znaczniki zaznaczenia, tabele i metadane strony.

Nowość w wersji 2.1: selection_marks właściwość, obsługa metod to_dict i from_dict

Dziedziczenie
builtins.object
FormPage

Konstruktor

FormPage(**kwargs: Any)

Metody

from_dict

Konwertuje dykt w kształcie elementu FormPage na sam model.

to_dict

Zwraca dyktową reprezentację elementu FormPage.

from_dict

Konwertuje dykt w kształcie elementu FormPage na sam model.

from_dict(data: Dict) -> FormPage

Parametry

data
dict
Wymagane

Słownik w kształcie elementu FormPage.

Zwraca

Strona formularza

Typ zwracany

to_dict

Zwraca dyktową reprezentację elementu FormPage.

to_dict() -> Dict

Zwraca

dict

Typ zwracany

Atrybuty

height

Wysokość obrazu/pliku PDF w pikselach/calach, odpowiednio.

height: float

lines

Gdy include_field_elements ma wartość true, zwracana jest lista rozpoznanych wierszy tekstowych. W przypadku wywołań rozpoznawania zawartości ta lista jest zawsze wypełniana. Maksymalna liczba zwracanych wierszy wynosi 300 na stronę. Linie są sortowane u góry do dołu, od lewej do prawej, chociaż w niektórych przypadkach bliskość jest traktowana z wyższym priorytetem. Ponieważ kolejność sortowania zależy od wykrytego tekstu, może ulec zmianie między obrazami i aktualizacjami wersji OCR. W związku z tym logika biznesowa powinna być oparta na rzeczywistej lokalizacji wiersza zamiast kolejności. Kolejność odczytu wierszy można określić za pomocą argumentu słowa kluczowego reading_order (Uwaga: reading_order obsługiwane tylko w begin_recognize_content i begin_recognize_content_from_url).

lines: List[FormLine]

page_number

Numer 1 strony, w której znajduje się ta zawartość.

page_number: int

selection_marks

Lista znaków wyboru wyodrębnionych ze strony.

selection_marks: List[FormSelectionMark]

tables

Lista wyodrębnionych tabel zawartych na stronie.

tables: List[FormTable]

text_angle

Ogólna orientacja tekstu w kierunku zegara mierzona w stopniach między (-180, 180).

text_angle: float

unit

Używane LengthUnit przez właściwości pola szerokości, wysokości i ograniczenia. W przypadku obrazów jednostka jest "piksel". W przypadku formatu PDF jednostka jest "cal".

unit: str

width

Szerokość obrazu/formatu PDF w pikselach/calach, odpowiednio.

width: float