DocumentPage Kelas
Elemen konten dan tata letak yang diekstrak dari halaman input.
Baru dalam versi 2023-07-31: Properti kode batang, dan rumus .
- Warisan
-
builtins.objectDocumentPage
Konstruktor
DocumentPage(**kwargs: Any)
Metode
from_dict |
Mengonversi dict dalam bentuk DocumentPage ke model itu sendiri. |
to_dict |
Mengembalikan representasi dict documentPage. |
from_dict
Mengonversi dict dalam bentuk DocumentPage ke model itu sendiri.
from_dict(data: Dict) -> DocumentPage
Parameter
Mengembalikan
HalamanDokumen
Tipe hasil
to_dict
Atribut
angle
Orientasi umum konten searah jarang, diukur dalam derajat antara (-180, 180].
angle: float | None
barcodes
Kode batang yang diekstrak dari halaman.
barcodes: List[DocumentBarcode]
formulas
Rumus yang diekstrak dari halaman
formulas: List[DocumentFormula]
height
Tinggi gambar/PDF dalam piksel/inci, masing-masing.
height: float | None
lines
Baris yang diekstrak dari halaman, berpotensi berisi elemen tekstual dan visual.
lines: List[DocumentLine]
page_number
Nomor halaman berbasis 1 dalam dokumen input.
page_number: int
selection_marks
Tanda pilihan yang diekstrak dari halaman.
selection_marks: List[DocumentSelectionMark]
spans
Lokasi halaman dalam urutan baca konten yang digabungkan.
spans: List[DocumentSpan]
unit
Unit yang digunakan oleh properti poligon lebar, tinggi, dan pembatas. Untuk gambar, unitnya adalah "piksel". Untuk PDF, unitnya adalah "inci". Nilai yang mungkin termasuk: "piksel", "inci".
unit: str | None
width
Lebar gambar/PDF masing-masing dalam piksel/inci.
width: float | None
words
Kata yang diekstrak dari halaman.
words: List[DocumentWord]
Azure SDK for Python
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk