Apache Spark gebruiken in Azure Databricks

Gevorderd
Data Engineer
Azure Databricks

Azure Databricks is gebaseerd op Apache Spark en stelt data engineers en analisten in staat Spark-taken uit te voeren om gegevens op schaal te transformeren, analyseren en visualiseren.

Leerdoelen

In deze module wordt het volgende behandeld:

  • Beschrijf de belangrijkste elementen van de Apache Spark-architectuur.
  • Een Spark-cluster maken en configureren.
  • Gebruiksvoorbeelden voor Spark beschrijven.
  • Spark gebruiken voor het verwerken en analyseren van gegevens die zijn opgeslagen in bestanden.
  • Spark gebruiken om gegevens te visualiseren.

Vereisten

Voordat u deze module start, moet u basiskennis van Azure Databricks hebben. Overweeg om de Azure Databricks-module verkennen vóór deze te voltooien.