Eseguire operazioni di ingegneria dei dati con pool di Apache Spark di Azure Synapse

Percorso di apprendimento
3 Moduli

Intermedio

Data engineer

Azure Synapse Analytics

Apache Spark è una soluzione di elaborazione distribuita altamente scalabile per l'analisi e la trasformazione di Big Data. È possibile sfruttarne la potenza in Azure Synapse Analytics usando pool di Spark.

Prerequisiti

Per iniziare questo percorso di apprendimento è consigliabile acquisire familiarità con Azure Synapse Analytics. Valutare la possibilità di completare prima il modulo Introduzione ad Azure Synapse Analytics.

Moduli in questo percorso di apprendimento

Analizzare i dati con Apache Spark in Azure Synapse Analytics

Apache Spark è una tecnologia di base per l'analisi dei dati su larga scala. Informazioni su come usare Spark in Azure Synapse Analytics per analizzare e visualizzare i dati in un data lake.

Trasformare i dati con Spark in Azure Synapse Analytics

Gli ingegneri dei dati devono in genere trasformare grandi volumi di dati. I pool di Apache Spark in Azure Synapse Analytics forniscono una piattaforma di elaborazione distribuita che è possibile usare allo scopo.

Usare Delta Lake in Azure Synapse Analytics

Delta Lake è un'area di archiviazione relazionale open source per Spark che è possibile usare per implementare un'architettura data lakehouse in Azure Synapse Analytics.