FormPage Kelas

Mewakili halaman yang dikenali dari dokumen input. Berisi baris, kata, tanda pilihan, tabel, dan metadata halaman.

Baru dalam versi v2.1: properti selection_marks, dukungan untuk metode to_dict dan from_dict

Warisan
builtins.object
FormPage

Konstruktor

FormPage(**kwargs: Any)

Metode

from_dict

Mengonversi dict dalam bentuk FormPage ke model itu sendiri.

to_dict

Mengembalikan representasi dict dari FormPage.

from_dict

Mengonversi dict dalam bentuk FormPage ke model itu sendiri.

from_dict(data: Dict) -> FormPage

Parameter

data
dict
Diperlukan

Kamus dalam bentuk FormPage.

Mengembalikan

Halaman Formulir

Tipe hasil

to_dict

Mengembalikan representasi dict dari FormPage.

to_dict() -> Dict

Mengembalikan

dict

Tipe hasil

Atribut

height

Tinggi gambar/PDF masing-masing dalam piksel/inci.

height: float

lines

Saat include_field_elements diatur ke true, daftar baris teks yang dikenali dikembalikan. Agar panggilan mengenali konten, daftar ini selalu diisi. Jumlah maksimum baris yang dikembalikan adalah 300 per halaman. Garis diurutkan dari atas ke bawah, kiri ke kanan, meskipun dalam kasus tertentu kedekatan diperlakukan dengan prioritas yang lebih tinggi. Karena urutan pengurutan tergantung pada teks yang terdeteksi, itu dapat berubah di seluruh gambar dan pembaruan versi OCR. Dengan demikian, logika bisnis harus dibangun di atas lokasi garis aktual alih-alih pesanan. Urutan membaca baris dapat ditentukan oleh argumen kata kunci reading_order (Catatan: reading_order hanya didukung di begin_recognize_content dan begin_recognize_content_from_url).

lines: List[FormLine]

page_number

Nomor 1 berbasis halaman tempat konten ini ada.

page_number: int

selection_marks

Daftar tanda pilihan yang diekstrak dari halaman.

selection_marks: List[FormSelectionMark]

tables

Daftar tabel yang diekstrak yang terkandung dalam halaman.

tables: List[FormTable]

text_angle

Orientasi umum teks searah jarang, diukur dalam derajat antara (-180, 180].

text_angle: float

unit

yang LengthUnit digunakan oleh properti lebar, tinggi, dan kotak pembatas. Untuk gambar, unitnya adalah "piksel". Untuk PDF, unitnya adalah "inch".

unit: str

width

Lebar gambar/PDF masing-masing dalam piksel/inci.

width: float