Brug Apache Spark i Azure Databricks

Øvet
Datatekniker
Azure Databricks

Azure Databricks er bygget på Apache Spark og gør det muligt for datateknikere og analytikere at køre Spark-job for at transformere, analysere og visualisere data i stor skala.

Læringsmål

I dette modul lærer du, hvordan du:

  • Beskriv vigtige elementer i Apache Spark-arkitekturen.
  • Opret og konfigurer en Spark-klynge.
  • Beskriv use cases for Spark.
  • Brug Spark til at behandle og analysere data, der er gemt i filer.
  • Brug Spark til at visualisere data.

Forudsætninger

Før du starter dette modul, skal du have et grundlæggende kendskab til Azure Databricks. Overvej at fuldføre modulet Udforsk Azure Databricks før dette.