Introduzione

Completato

Azure Databricks offre una piattaforma altamente scalabile per l'analisi e l'elaborazione dei dati tramite Apache Spark.

Spark è una piattaforma flessibile che supporta molti linguaggi di programmazione e API diversi. La maggior parte delle attività di elaborazione e analisi dei dati può essere eseguita usando l'API Dataframe, ovvero l'argomento centrale di questo modulo.

Contenuto del modulo:

  • Descrivere gli elementi chiave dell'architettura di Apache Spark.
  • Creare e configurare un cluster Spark.
  • Descrivere i casi d'uso per Spark.
  • Usare Spark per elaborare e analizzare i dati archiviati nei file.
  • Usare Spark per visualizzare i dati.