Použití Apache Sparku v Azure Databricks
Služba Azure Databricks je postavená na Apache Sparku a umožňuje datovým inženýrům a analytikům spouštět úlohy Sparku za účelem transformace, analýzy a vizualizace dat ve velkém měřítku.
Cíle výuky
V tomto modulu:
- Popis klíčových prvků architektury Apache Sparku
- Vytvořte a nakonfigurujte cluster Spark.
- Popište případy použití Sparku.
- Pomocí Sparku můžete zpracovávat a analyzovat data uložená v souborech.
- K vizualizaci dat použijte Spark.
Požadavky
Před zahájením tohoto modulu byste měli mít základní znalosti Azure Databricks. Zvažte dokončení předchozích modulů v Datové Inženýrství s Azure Databricks před tímto studijním programem.