Pendahuluan

Selesai

Delta Lake Linux foundation adalah lapisan penyimpanan sumber terbuka untuk Spark yang mengaktifkan kemampuan database hubungan untuk batch dan data streaming. Dengan menggunakan Delta Lake, Anda dapat menerapkan arsitektur data lakehouse di Spark untuk mendukung semantik manipulasi data berbasis SQL dengan dukungan untuk transaksi dan pemberlakuan skema. Hasilnya adalah penyimpanan data analitis yang menawarkan banyak keuntungan atas sistem database hubungan dengan fleksibilitas pada penyimpanan file data di data lake.

Dalam modul ini, Anda akan mempelajari cara:

  • Jelaskan fitur utama serta kemampuan Delta Lake.
  • Membuat dan menggunakan tabel Delta Lake di Azure Databricks.
  • Buat tabel katalog Spark untuk data Delta Lake.
  • Gunakan tabel Delta Lake untuk data streaming.

Catatan

Versi Delta Lake yang tersedia di kluster Azure Databricks bergantung pada versi Databricks Runtime yang digunakan. Informasi dalam modul ini mencerminkan Delta Lake versi 3.x, yang diinstal dengan Spark 3.5.0 di Databricks Runtime versi 14.3.