Bagikan melalui


DocumentPage Kelas

Elemen konten dan tata letak yang diekstrak dari halaman input.

Baru dalam versi 2023-07-31: Properti kode batang, dan rumus .

Warisan
builtins.object
DocumentPage

Konstruktor

DocumentPage(**kwargs: Any)

Metode

from_dict

Mengonversi dict dalam bentuk DocumentPage ke model itu sendiri.

to_dict

Mengembalikan representasi dict documentPage.

from_dict

Mengonversi dict dalam bentuk DocumentPage ke model itu sendiri.

from_dict(data: Dict) -> DocumentPage

Parameter

data
dict
Diperlukan

Kamus dalam bentuk DocumentPage.

Mengembalikan

HalamanDokumen

Tipe hasil

to_dict

Mengembalikan representasi dict documentPage.

to_dict() -> Dict

Mengembalikan

dict

Tipe hasil

Atribut

angle

Orientasi umum konten searah jarang, diukur dalam derajat antara (-180, 180].

angle: float | None

barcodes

Kode batang yang diekstrak dari halaman.

barcodes: List[DocumentBarcode]

formulas

Rumus yang diekstrak dari halaman

formulas: List[DocumentFormula]

height

Tinggi gambar/PDF dalam piksel/inci, masing-masing.

height: float | None

lines

Baris yang diekstrak dari halaman, berpotensi berisi elemen tekstual dan visual.

lines: List[DocumentLine]

page_number

Nomor halaman berbasis 1 dalam dokumen input.

page_number: int

selection_marks

Tanda pilihan yang diekstrak dari halaman.

selection_marks: List[DocumentSelectionMark]

spans

Lokasi halaman dalam urutan baca konten yang digabungkan.

spans: List[DocumentSpan]

unit

Unit yang digunakan oleh properti poligon lebar, tinggi, dan pembatas. Untuk gambar, unitnya adalah "piksel". Untuk PDF, unitnya adalah "inci". Nilai yang mungkin termasuk: "piksel", "inci".

unit: str | None

width

Lebar gambar/PDF masing-masing dalam piksel/inci.

width: float | None

words

Kata yang diekstrak dari halaman.

words: List[DocumentWord]