Použití Apache Sparku v Azure Databricks

Středně pokročilý
Data Engineer
Azure Databricks

Azure Databricks je založený na Apache Sparku a umožňuje datovým inženýrům a analytikům spouštět úlohy Sparku pro transformaci, analýzu a vizualizaci dat ve velkém měřítku.

Cíle výuky

V tomto modulu:

  • Popis klíčových prvků architektury Apache Spark
  • Vytvoření a konfigurace clusteru Spark
  • Popište případy použití Sparku.
  • Pomocí Sparku můžete zpracovávat a analyzovat data uložená v souborech.
  • Pomocí Sparku můžete vizualizovat data.

Požadavky

Než začnete s tímto modulem, měli byste mít základní znalosti Azure Databricks. Zvažte dokončení modulu Prozkoumat Azure Databricks před tímto modulem.