Úvod

Dokončeno

Azure Databricks nabízí vysoce škálovatelnou platformu pro analýzu a zpracování dat pomocí Apache Sparku.

Spark je flexibilní platforma, která podporuje mnoho různých programovacích jazyků a rozhraní API. Většinu úloh zpracování a analýzy dat je možné provádět pomocí rozhraní API datového rámce , na které se v tomto modulu zaměříme.

V tomto modulu:

  • Popis klíčových prvků architektury Apache Spark
  • Vytvoření a konfigurace clusteru Spark
  • Popište případy použití Sparku.
  • Pomocí Sparku můžete zpracovávat a analyzovat data uložená v souborech.
  • Pomocí Sparku můžete vizualizovat data.