Riepilogo

Completato

Apache Spark è una tecnologia chiave usata nell'analisi dei Big Data e il supporto di Spark in Azure Databricks consente di combinare l'elaborazione dei Big Data in Spark con l'analisi dei dati su larga scala.

Contenuto del modulo:

  • Descrivere gli elementi chiave dell'architettura di Apache Spark.
  • Creare e configurare un cluster Spark.
  • Descrivere i casi d'uso per Spark.
  • Usare Spark per elaborare e analizzare i dati archiviati nei file.
  • Usare Spark per visualizzare i dati.