Trasformare i dati con Spark in Azure Synapse Analytics

Intermedio
Data engineer
Azure Synapse Analytics

Gli ingegneri dei dati devono in genere trasformare grandi volumi di dati. I pool di Apache Spark in Azure Synapse Analytics forniscono una piattaforma di elaborazione distribuita che è possibile usare allo scopo.

Obiettivi di apprendimento

Contenuto del modulo:

  • Usare Apache Spark per modificare e salvare i dataframe
  • Partizionare i file di dati per migliorare le prestazioni e la scalabilità.
  • Trasformare i dati con SQL

Prerequisiti

Prima di procedere con questo modulo, è necessario avere familiarità con i pool di Apache Spark in Azure Synapse Analytics. Considerare la possibilità di completare prima il modulo Analizzare i dati con Apache Spark in Azure Synapse Analytics.