Trasformare i dati con Spark in Azure Synapse Analytics
Gli ingegneri dei dati devono in genere trasformare grandi volumi di dati. I pool di Apache Spark in Azure Synapse Analytics forniscono una piattaforma di elaborazione distribuita che è possibile usare allo scopo.
Obiettivi di apprendimento
Contenuto del modulo:
- Usare Apache Spark per modificare e salvare i dataframe
- Partizionare i file di dati per migliorare le prestazioni e la scalabilità.
- Trasformare i dati con SQL
Prerequisiti
Prima di procedere con questo modulo, è necessario avere familiarità con i pool di Apache Spark in Azure Synapse Analytics. Considerare la possibilità di completare prima il modulo Analizzare i dati con Apache Spark in Azure Synapse Analytics.