Oversigt
Apache Spark er en vigtig teknologi, der bruges i datatransformation og big data-analyser. Spark-understøttelsen i Azure Databricks giver dig mulighed for at kombinere big data-behandling i Spark med dataanalyse i stor skala.
I dette modul har du lært, hvordan du:
- Beskriv vigtige elementer i Apache Spark-arkitekturen.
- Opret og konfigurer en Spark-klynge.
- Beskriv use cases for Spark.
- Brug Spark til at behandle og analysere data, der er gemt i filer.
- Brug Spark til at visualisere data.