Shrnutí
Apache Spark je klíčová technologie používaná při analýze velkých objemů dat a podpora Sparku v Azure Databricks umožňuje kombinovat zpracování velkých objemů dat ve Sparku s rozsáhlými analýzami dat.
V tomto modulu jste se naučili:
- Popis klíčových prvků architektury Apache Spark
- Vytvoření a konfigurace clusteru Spark
- Popište případy použití Sparku.
- Pomocí Sparku můžete zpracovávat a analyzovat data uložená v souborech.
- Pomocí Sparku můžete vizualizovat data.