Trasformare i dati con Spark in Azure Synapse Analytics

Modulo
7 Unità

Intermedio

Data engineer

Azure Synapse Analytics

Gli ingegneri dei dati devono in genere trasformare grandi volumi di dati. I pool di Apache Spark in Azure Synapse Analytics forniscono una piattaforma di elaborazione distribuita che è possibile usare allo scopo.

Obiettivi di apprendimento

Contenuto del modulo:

Usare Apache Spark per modificare e salvare i dataframe
Partizionare i file di dati per migliorare le prestazioni e la scalabilità.
Trasformare i dati con SQL

Prerequisiti

Prima di procedere con questo modulo, è necessario avere familiarità con i pool di Apache Spark in Azure Synapse Analytics. Considerare la possibilità di completare prima il modulo Analizzare i dati con Apache Spark in Azure Synapse Analytics.

Introduzione min
Modificare e salvare i dataframe min
Partizionare i file di dati min
Trasformare i dati con SQL min
Esercizio - Trasformare i dati con Spark in Azure Synapse Analytics min
Verifica delle conoscenze min
Riepilogo min