Rekayasa data dengan Azure Databricks

Menengah
Teknisi Data
Databricks

Pelajari cara memanfaatkan kekuatan Apache Spark dan kluster kuat yang berjalan di platform Azure Databricks untuk menjalankan beban kerja rekayasa data besar di cloud.

Prasyarat

Tidak ada

Modul dalam jalur pembelajaran ini

Azure Databricks adalah layanan cloud yang menyediakan platform terukur untuk analitik data menggunakan Apache Spark.

Azure Databricks dibangun di atas Apache Spark dan memungkinkan teknisi dan analis data menjalankan tugas Spark untuk mengubah, menganalisis, dan memvisualisasikan data dalam skala besar.

Delta Lake adalah area penyimpanan relasional sumber terbuka untuk Spark yang dapat Anda gunakan untuk menerapkan arsitektur data lakehouse di Azure Databricks.

Azure Databricks menyediakan Gudang SQL yang memungkinkan analis data bekerja dengan data menggunakan kueri SQL relasional yang sudah dikenal.

Menggunakan alur di Azure Data Factory untuk menjalankan notebooks di Azure Databricks memungkinkan Anda mengotomatiskan proses rekayasa data pada skala cloud.