Data engineering uitvoeren met Azure Synapse Apache Spark-pools

Gevorderd
Data Engineer
Azure Synapse Analytics

Apache Spark is een zeer schaalbare gedistribueerde verwerkingsoplossing voor analyse en transformatie van big data. U kunt gebruikmaken van de kracht in Azure Synapse Analytics met behulp van Spark-pools.

Vereisten

Voordat u aan dit leertraject begint, moet u bekend zijn met Azure Synapse Analytics. Overweeg eerst de module Inleiding tot Azure Synapse Analytics te voltooien.

Modules in dit leertraject

Apache Spark is een kerntechnologie voor grootschalige gegevensanalyse. Meer informatie over het gebruik van Spark in Azure Synapse Analytics voor het analyseren en visualiseren van gegevens in een data lake.

Data engineers moeten vaak grote hoeveelheden gegevens transformeren. Apache Spark-pools in Azure Synapse Analytics bieden een gedistribueerd verwerkingsplatform dat ze kunnen gebruiken om dit doel te bereiken.

Delta Lake is een open source relationele opslagruimte voor Spark die u kunt gebruiken om een data lakehouse-architectuur te implementeren in Azure Synapse Analytics.