Usare Apache Spark in Azure Databricks

Intermedio
Data engineer
Azure Databricks

Azure Databricks è basato su Apache Spark e consente agli ingegneri dei dati e agli analisti di eseguire processi Spark per trasformare, analizzare e visualizzare i dati su larga scala.

Obiettivi di apprendimento

Contenuto del modulo:

  • Descrivere gli elementi chiave dell'architettura di Apache Spark.
  • Creare e configurare un cluster Spark.
  • Descrivere i casi d'uso per Spark.
  • Usare Spark per elaborare e analizzare i dati archiviati nei file.
  • Usare Spark per visualizzare i dati.

Prerequisiti

Prima di iniziare questo modulo, è necessario avere una conoscenza di base di Azure Databricks. È consigliabile completare il modulo di Esplorare Azure Databricks prima di questo modulo.