Apa itu tabel di Azure Databricks?

Di Azure Databricks, tabel adalah kumpulan data terstruktur yang disimpan dalam skema. Tabel digunakan untuk menyimpan, mengkueri, dan mengelola data menggunakan SQL atau Spark. Jenis tabel default adalah tabel terkelola Unity Catalog, yang menggunakan Delta Lake untuk penyimpanan data yang andal.

Azure Databricks mendukung tiga jenis tabel utama, masing-masing dengan karakteristik kepemilikan dan manajemen data yang berbeda:

Jenis tabel Deskripsi Dikelola oleh Menulis dukungan
Terkelola Azure Databricks mengelola metadata dan file data. Katalog Unity Ya
Eksternal Metadata berada di Azure Databricks, data disimpan secara eksternal. Tidak ada atau Unity Catalog Ya
Asing Mereferensikan data baca-saja dalam sistem eksternal melalui federasi. Sistem eksternal Tidak.
Sementara Tabel bercakupan sesi untuk penyimpanan data perantara. Tidak ada (cakupan sesi) Ya

Untuk sebagian besar kasus penggunaan, Databricks merekomendasikan penggunaan tabel terkelola.