Menggunakan Apache Spark di Azure Databricks

Menengah
Data Engineer
Azure Databricks

Azure Databricks dibangun di atas Apache Spark dan memungkinkan teknisi dan analis data menjalankan tugas Spark untuk mengubah, menganalisis, dan memvisualisasikan data dalam skala besar.

Tujuan pembelajaran

Dalam modul ini, Anda akan mempelajari cara:

  • Menjelaskan elemen utama dari arsitektur Apache Spark.
  • Membuat dan mengonfigurasi kluster Spark.
  • Menjelaskan kasus penggunaan untuk Spark.
  • Menggunakan Spark untuk memproses dan menganalisis data yang disimpan dalam file.
  • Menggunakan Spark untuk memvisualisasikan data.

Prasyarat

Sebelum memulai modul ini, Anda harus memiliki pengetahuan dasar tentang Azure Databricks. Pertimbangkan untuk menyelesaikan modul Jelajahi Azure Databricks sebelum modul ini.