Apache Spark gebruiken in Azure Databricks

Module
9 Eenheden

Gevorderd

Data Engineer

Azure Databricks

Azure Databricks is gebaseerd op Apache Spark en stelt data engineers en analisten in staat Spark-taken uit te voeren om gegevens op schaal te transformeren, analyseren en visualiseren.

Leerdoelen

In deze module wordt het volgende behandeld:

Beschrijf de belangrijkste elementen van de Apache Spark-architectuur.
Een Spark-cluster maken en configureren.
Gebruiksvoorbeelden voor Spark beschrijven.
Spark gebruiken voor het verwerken en analyseren van gegevens die zijn opgeslagen in bestanden.
Spark gebruiken om gegevens te visualiseren.

Vereisten

Voordat u deze module start, moet u basiskennis van Azure Databricks hebben. Overweeg om de Azure Databricks-module verkennen vóór deze te voltooien.

Inleiding min
Kennismaken met Spark min
Een Spark-cluster maken min
Spark gebruiken in notebooks min
Spark gebruiken om te werken met gegevensbestanden min
Gegevens visualiseren min
Oefening: Spark gebruiken in Azure Databricks min
Kenniscontrole min
Samenvatting min