Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengurai kolom yang berisi data biner (blob) dan mengembalikan VariantType. Melempar pengecualian jika blob input tidak valid.
Syntax
from pyspark.sql import functions as dbf
dbf.ai_parse_document(col=<col>, options=<options>)
Parameter-parameternya
| Pengaturan | Tipe | Description |
|---|---|---|
col |
pyspark.sql.Column atau data biner |
Nama kolom atau kolom yang berisi blob biner untuk diurai. |
options |
dictfakultatif |
Kamus opsi untuk mengontrol perilaku penguraian. |
Pengembalian Barang
pyspark.sql.Column: Kolom baru VariantType yang berisi hasil penguraian dokumen. Hasilnya mencakup document objek dengan pages array dan elements , bersama dengan error_status dan metadata. Setiap elemen mewakili satuan konten diskrit dalam dokumen yang diurai, seperti paragraf teks, tabel, gambar, atau penanda tata letak. Untuk skema output lengkap dan detail tentang elemen, lihat ai_parse_document.