Ringkasan

Selesai

Apache Spark adalah teknologi utama yang digunakan dalam transformasi data dan analitik big data. Dukungan Spark di Azure Databricks memungkinkan Anda menggabungkan pemrosesan big data di Spark dengan analitik data skala besar.

Dalam modul ini, Anda belajar cara:

  • Menjelaskan elemen utama dari arsitektur Apache Spark.
  • Membuat dan mengonfigurasi kluster Spark.
  • Menjelaskan kasus penggunaan untuk Spark.
  • Menggunakan Spark untuk memproses dan menganalisis data yang disimpan dalam file.
  • Menggunakan Spark untuk memvisualisasikan data.