Udostępnij za pośrednictwem


DocumentPage Klasa

Zawartość i elementy układu wyodrębnione ze strony danych wejściowych.

Nowość w wersji 2023-07-31: właściwości kodów kreskowych i formuł .

Dziedziczenie
builtins.object
DocumentPage

Konstruktor

DocumentPage(**kwargs: Any)

Metody

from_dict

Konwertuje dykt w kształcie elementu DocumentPage na sam model.

to_dict

Zwraca dyktową reprezentację elementu DocumentPage.

from_dict

Konwertuje dykt w kształcie elementu DocumentPage na sam model.

from_dict(data: Dict) -> DocumentPage

Parametry

data
dict
Wymagane

Słownik w kształcie elementu DocumentPage.

Zwraca

Documentpage

Typ zwracany

to_dict

Zwraca dyktową reprezentację elementu DocumentPage.

to_dict() -> Dict

Zwraca

dict

Typ zwracany

Atrybuty

angle

Ogólna orientacja zawartości w kierunku wskazówek zegara, mierzona w stopniach między (-180, 180).

angle: float | None

barcodes

Wyodrębnione kody kreskowe ze strony.

barcodes: List[DocumentBarcode]

formulas

Wyodrębnione formuły ze strony

formulas: List[DocumentFormula]

height

Wysokość obrazu/pliku PDF odpowiednio w pikselach/calach.

height: float | None

lines

Wyodrębnione wiersze ze strony, potencjalnie zawierające elementy tekstowe i wizualne.

lines: List[DocumentLine]

page_number

Numer strony 1 w dokumencie wejściowym.

page_number: int

selection_marks

Wyodrębnione znaczniki zaznaczenia ze strony.

selection_marks: List[DocumentSelectionMark]

spans

Lokalizacja strony w kolejności odczytu połączona zawartość.

spans: List[DocumentSpan]

unit

Jednostka używana przez właściwości wielokątne szerokości, wysokości i ograniczenia. W przypadku obrazów jednostka jest "pixel". W przypadku formatu PDF jednostka jest "cal". Możliwe wartości to: "pixel", "inch".

unit: str | None

width

Szerokość obrazu/pliku PDF odpowiednio w pikselach/calach.

width: float | None

words

Wyodrębnione wyrazy ze strony.

words: List[DocumentWord]