Utföra datateknikuppgifter med Azure Synapse Apache Spark-pooler

Medel
Data Engineer
Azure Synapse Analytics

Apache Spark är en mycket skalbar distribuerad bearbetningslösning för stordataanalys och omvandling. Du kan utnyttja dess kraft i Azure Synapse Analytics med hjälp av Spark-pooler.

Förutsättningar

Innan du påbörjar den här utbildningsvägen bör du känna till Azure Synapse Analytics. Överväg att slutföra modulen Introduktion till Azure Synapse Analytics först.

Moduler i den här utbildningsvägen

Apache Spark är en kärnteknik för storskalig dataanalys. Lär dig hur du använder Spark i Azure Synapse Analytics för att analysera och visualisera data i en datasjö.

Datatekniker behöver vanligtvis transformera stora mängder data. Apache Spark-pooler i Azure Synapse Analytics tillhandahåller en distribuerad bearbetningsplattform som de kan använda för att uppnå det här målet.

Delta Lake är ett öppen källkod relationslagringsområde för Spark som du kan använda för att implementera en data lakehouse-arkitektur i Azure Synapse Analytics.