baca (DataSourceStreamReader)

Menghasilkan data untuk partisi tertentu dan mengembalikan iterator tuple atau baris.

Metode ini dipanggil sekali per partisi untuk membaca data. Menerapkan metode ini diperlukan untuk pembaca streaming. Anda dapat menginisialisasi sumber daya yang tidak dapat diserialisasi yang diperlukan untuk membaca data dari sumber data dalam metode ini.

Ditambahkan dalam Databricks Runtime 15.2

Sintaksis

read(partition: InputPartition)

Parameter-parameternya

Parameter Tipe Deskripsi
partition InputPartition Partisi yang akan dibaca. Ini harus menjadi salah satu nilai partisi yang dikembalikan oleh partitions().

Pengembalian Barang

Iterator[Tuple] atau Iterator[RecordBatch]

Iterator tuple atau baris. Setiap tuple atau baris akan dikonversi menjadi baris di DataFrame akhir. Ini juga dapat mengembalikan iterator objek PyArrow RecordBatch jika sumber data mendukungnya.

Catatan

Metode ini statis dan tanpa status. Jangan mengakses anggota kelas yang dapat diubah atau menyimpan status dalam memori di antara pemanggilan yang berbeda dari read().