Az Apache Spark használata az Azure Databricksben

Haladó
Data Engineer
Azure Databricks

Az Azure Databricks az Apache Sparkra épül, és lehetővé teszi az adatmérnökök és elemzők számára, hogy Spark-feladatokat futtasson az adatok nagy léptékű átalakításához, elemzéséhez és vizualizációjához.

Tanulási célkitűzések

Ebben a modulban a következőket sajátíthatja el:

  • Az Apache Spark-architektúra főbb elemeinek ismertetése.
  • Spark-fürt létrehozása és konfigurálása.
  • A Spark használati eseteinek leírása.
  • A Spark használatával feldolgozhatja és elemezheti a fájlokban tárolt adatokat.
  • Adatok vizualizációja a Spark használatával.

Előfeltételek

A modul megkezdése előtt rendelkeznie kell az Azure Databricks alapszintű ismeretével. Fontolja meg az Azure Databricks felfedezése modul elvégzését a fenti előtt.