Data engineering uitvoeren met Azure Synapse Apache Spark-pools

Leertraject
3 Modules

Gevorderd

Data Engineer

Azure Synapse Analytics

Apache Spark is een zeer schaalbare gedistribueerde verwerkingsoplossing voor analyse en transformatie van big data. U kunt gebruikmaken van de kracht in Azure Synapse Analytics met behulp van Spark-pools.

Vereisten

Voordat u aan dit leertraject begint, moet u bekend zijn met Azure Synapse Analytics. Overweeg eerst de module Inleiding tot Azure Synapse Analytics te voltooien.

Modules in dit leertraject

Gegevens analyseren met Apache Spark in Azure Synapse Analytics

Apache Spark is een kerntechnologie voor grootschalige gegevensanalyse. Meer informatie over het gebruik van Spark in Azure Synapse Analytics voor het analyseren en visualiseren van gegevens in een data lake.

Gegevens transformeren met Spark in Azure Synapse Analytics

Data engineers moeten vaak grote hoeveelheden gegevens transformeren. Apache Spark-pools in Azure Synapse Analytics bieden een gedistribueerd verwerkingsplatform dat ze kunnen gebruiken om dit doel te bereiken.

Delta Lake gebruiken in Azure Synapse Analytics

Delta Lake is een open source relationele opslagruimte voor Spark die u kunt gebruiken om een data lakehouse-architectuur te implementeren in Azure Synapse Analytics.