Použití Apache Sparku v Azure Databricks

Středně pokročilý
Data Engineer
Azure Databricks

Služba Azure Databricks je postavená na Apache Sparku a umožňuje datovým inženýrům a analytikům spouštět úlohy Sparku za účelem transformace, analýzy a vizualizace dat ve velkém měřítku.

Cíle výuky

V tomto modulu:

  • Popis klíčových prvků architektury Apache Sparku
  • Vytvořte a nakonfigurujte cluster Spark.
  • Popište případy použití Sparku.
  • Pomocí Sparku můžete zpracovávat a analyzovat data uložená v souborech.
  • K vizualizaci dat použijte Spark.

Požadavky

Před zahájením tohoto modulu byste měli mít základní znalosti Azure Databricks. Zvažte dokončení předchozích modulů v Datové Inženýrství s Azure Databricks před tímto studijním programem.