Eseguire operazioni di ingegneria dei dati con pool di Apache Spark di Azure Synapse

Intermedio
Data engineer
Azure Synapse Analytics

Apache Spark è una soluzione di elaborazione distribuita altamente scalabile per l'analisi e la trasformazione di Big Data. È possibile sfruttarne la potenza in Azure Synapse Analytics usando pool di Spark.

Prerequisiti

Per iniziare questo percorso di apprendimento è consigliabile acquisire familiarità con Azure Synapse Analytics. Valutare la possibilità di completare prima il modulo Introduzione ad Azure Synapse Analytics.

Moduli in questo percorso di apprendimento

Apache Spark è una tecnologia di base per l'analisi dei dati su larga scala. Informazioni su come usare Spark in Azure Synapse Analytics per analizzare e visualizzare i dati in un data lake.

Gli ingegneri dei dati devono in genere trasformare grandi volumi di dati. I pool di Apache Spark in Azure Synapse Analytics forniscono una piattaforma di elaborazione distribuita che è possibile usare allo scopo.

Delta Lake è un'area di archiviazione relazionale open source per Spark che è possibile usare per implementare un'architettura data lakehouse in Azure Synapse Analytics.