Pengantar

Selesai

Azure Databricks menawarkan platform yang sangat skalabel untuk pemrosesan dan analitik data menggunakan Apache Spark.

Spark adalah platform fleksibel yang mendukung banyak bahasa pemrograman dan API yang berbeda. Sebagian besar tugas pemrosesan data dan analisis dapat diselesaikan menggunakan API Dataframe, yang akan kami fokuskan dalam modul ini.

Dalam modul ini, Anda akan mempelajari cara:

  • Menjelaskan elemen utama dari arsitektur Apache Spark.
  • Membuat dan mengonfigurasi kluster Spark.
  • Menjelaskan kasus penggunaan untuk Spark.
  • Menggunakan Spark untuk memproses dan menganalisis data yang disimpan dalam file.
  • Menggunakan Spark untuk memvisualisasikan data.