Introduzione
Azure Databricks offre una piattaforma altamente scalabile per l'analisi e l'elaborazione dei dati tramite Apache Spark.
Spark è una piattaforma flessibile che supporta molti linguaggi di programmazione e API diversi. La maggior parte delle attività di elaborazione e analisi dei dati può essere eseguita usando l'API Dataframe, ovvero l'argomento centrale di questo modulo.
Contenuto del modulo:
- Descrivere gli elementi chiave dell'architettura di Apache Spark.
- Creare e configurare un cluster Spark.
- Descrivere i casi d'uso per Spark.
- Usare Spark per elaborare e analizzare i dati archiviati nei file.
- Usare Spark per visualizzare i dati.