Een Data Analytics-oplossing implementeren met Azure Databricks

Gevorderd
Data Engineer
Azure Databricks

Ontdek hoe u de kracht van Apache Spark en krachtige clusters die op het Azure Databricks-platform kunt inzetten om grote data engineering-workloads in cloud uit te voeren.

Vereisten

Geen

Modules in dit leertraject

Azure Databricks is een cloudservice die een schaalbaar platform biedt voor gegevensanalyse met behulp van Apache Spark.

Azure Databricks is gebaseerd op Apache Spark en stelt data engineers en analisten in staat Spark-taken uit te voeren om gegevens op schaal te transformeren, analyseren en visualiseren.

Delta Lake is een open source relationele opslagruimte voor Spark die u kunt gebruiken om een data lakehouse-architectuur in Azure Databricks te implementeren.

Azure Databricks biedt SQL Warehouses waarmee gegevensanalisten met gegevens kunnen werken met behulp van bekende relationele SQL-query's.

Door pijplijnen in Azure Data Factory te gebruiken om notebooks uit te voeren in Azure Databricks, kunt u data engineeringprocessen op cloudschaal automatiseren.