Menerapkan Solusi Analitik Data dengan Azure Databricks

Jalur Pembelajaran
5 Modul

Menengah

Data Engineer

Azure Databricks

Pelajari cara memanfaatkan kekuatan Apache Spark dan kluster kuat yang berjalan di platform Azure Databricks untuk menjalankan beban kerja rekayasa data besar di cloud.

Prasyarat

Tidak

Modul dalam jalur pembelajaran ini

Menjelajahi Azure Databricks

Azure Databricks adalah layanan cloud yang menyediakan platform terukur untuk analitik data menggunakan Apache Spark.

Menggunakan Apache Spark di Azure Databricks

Azure Databricks dibangun di atas Apache Spark dan memungkinkan teknisi dan analis data menjalankan tugas Spark untuk mengubah, menganalisis, dan memvisualisasikan data dalam skala besar.

Menggunakan Delta Lake di Azure Databricks

Delta Lake adalah area penyimpanan relasional sumber terbuka untuk Spark yang dapat digunakan untuk mengimplementasikan arsitektur data lakehouse di Azure Databricks.

Menggunakan Gudang SQL di Azure Databricks

Azure Databricks menyediakan Gudang SQL yang memungkinkan analis data bekerja dengan data menggunakan kueri SQL relasional yang sudah dikenal.

Menjalankan Notebooks Azure Databricks dengan Azure Data Factory

Menggunakan alur di Azure Data Factory untuk menjalankan notebooks di Azure Databricks memungkinkan Anda mengotomatiskan proses rekayasa data pada skala cloud.