Menerapkan Solusi Analitik Data dengan Azure Databricks

Menengah
Data Engineer
Azure Databricks

Pelajari cara memanfaatkan kekuatan Apache Spark dan kluster canggih yang berjalan di platform Azure Databricks untuk menjalankan beban kerja analitik data di data lakehouse.

Prasyarat

Tidak

Modul dalam jalur pembelajaran ini

Azure Databricks adalah layanan cloud yang menyediakan platform terukur untuk analitik data menggunakan Apache Spark.

Azure Databricks dibangun di atas Apache Spark dan memungkinkan teknisi dan analis data menjalankan tugas Spark untuk mengubah, menganalisis, dan memvisualisasikan data dalam skala besar.

Delta Lake adalah area penyimpanan relasional sumber terbuka untuk Spark yang dapat digunakan untuk mengimplementasikan arsitektur data lakehouse di Azure Databricks.

Azure Databricks menyediakan Gudang SQL yang memungkinkan analis data bekerja dengan data menggunakan kueri SQL relasional yang sudah dikenal.

Menggunakan alur di Azure Data Factory untuk menjalankan notebooks di Azure Databricks memungkinkan Anda mengotomatiskan proses rekayasa data pada skala cloud.