ai_parse_document

Mengurai kolom yang berisi data biner (blob) dan mengembalikan VariantType. Melempar pengecualian jika blob input tidak valid.

Syntax

from pyspark.sql import functions as dbf

dbf.ai_parse_document(col=<col>, options=<options>)

Parameter-parameternya

Pengaturan Tipe Description
col pyspark.sql.Column atau data biner Nama kolom atau kolom yang berisi blob biner untuk diurai.
options dictfakultatif Kamus opsi untuk mengontrol perilaku penguraian.

Pengembalian Barang

pyspark.sql.Column: Kolom baru VariantType yang berisi hasil penguraian dokumen. Hasilnya mencakup document objek dengan pages array dan elements , bersama dengan error_status dan metadata. Setiap elemen mewakili satuan konten diskrit dalam dokumen yang diurai, seperti paragraf teks, tabel, gambar, atau penanda tata letak. Untuk skema output lengkap dan detail tentang elemen, lihat ai_parse_document.