Eseguire operazioni di ingegneria dei dati con pool di Apache Spark di Azure Synapse

Intermedio
Data engineer
Synapse Analytics

Informazioni su come eseguire operazioni di ingegneria dei dati con i pool di Apache Spark di Azure Synapse, che consentono di migliorare le prestazioni delle applicazioni per l'analisi di Big Data tramite il cluster computing in memoria.

Prerequisiti

  • Si consiglia agli studenti di completare i Concetti fondamentali sui dati prima di iniziare questo percorso di apprendimento.

Moduli in questo percorso di apprendimento

Apache Spark è una tecnologia di base per l'analisi dei dati su larga scala. Informazioni su come usare Spark in Azure Synapse Analytics per analizzare e visualizzare i dati in un data lake.

Delta Lake è un'area di archiviazione relazionale open source per Spark che è possibile usare per implementare un'architettura data lakehouse in Azure Synapse Analytics.

Informazioni su come integrare pool SQL e di Apache Spark in Azure Synapse Analytics.

Informazioni su come monitorare e gestire i carichi di lavoro di ingegneria dei dati con Apache Spark in Azure Synapse Analytics.