Menggunakan Apache Spark di Azure Databricks
Azure Databricks dibangun di atas Apache Spark dan memungkinkan teknisi dan analis data menjalankan tugas Spark untuk mengubah, menganalisis, dan memvisualisasikan data dalam skala besar.
Tujuan pembelajaran
Dalam modul ini, Anda akan mempelajari cara:
- Menjelaskan elemen utama dari arsitektur Apache Spark.
- Membuat dan mengonfigurasi kluster Spark.
- Menjelaskan kasus penggunaan untuk Spark.
- Menggunakan Spark untuk memproses dan menganalisis data yang disimpan dalam file.
- Menggunakan Spark untuk memvisualisasikan data.
Prasyarat
Sebelum memulai modul ini, Anda harus memiliki pengetahuan dasar tentang Azure Databricks. Pertimbangkan untuk menyelesaikan modul Jelajahi Azure Databricks sebelum modul ini.