Brug Apache Spark i Azure Databricks

Modul
9 Enheder

Øvet

Datatekniker

Azure Databricks

Azure Databricks er bygget på Apache Spark og gør det muligt for datateknikere og analytikere at køre Spark-job for at transformere, analysere og visualisere data i stor skala.

Læringsmål

I dette modul lærer du, hvordan du:

Beskriv vigtige elementer i Apache Spark-arkitekturen.
Opret og konfigurer en Spark-klynge.
Beskriv use cases for Spark.
Brug Spark til at behandle og analysere data, der er gemt i filer.
Brug Spark til at visualisere data.

Forudsætninger

Før du starter dette modul, skal du have et grundlæggende kendskab til Azure Databricks. Overvej at fuldføre modulet Udforsk Azure Databricks før dette.

Introduktion min
Lær Spark at kende min
Opret en Spark-klynge min
Brug Spark i notesbøger min
Brug Spark til at arbejde med datafiler min
Visualiser data min
Øvelse – Brug Spark i Azure Databricks min
Modulvurdering min
Oversigt min

Start