Příprava dat pomocí Azure Databricks

Středně pokročilý
Odborník na data
Databricks

Zjistěte, jak využít výkon Apache Spark a výkonné clustery běžící na platformě Azure Databricks ke spouštění rozsáhlých úloh v rámci přípravy dat v cloudu.

Požadavky

Žádné

Moduly v tomto studijním programu

Azure Databricks je cloudová služba, která poskytuje škálovatelnou platformu pro analýzu dat pomocí Apache Sparku.

Azure Databricks je založený na Apache Sparku a umožňuje datovým inženýrům a analytikům spouštět úlohy Sparku, které transformují, analyzují a vizualizují data ve velkém měřítku.

Delta Lake je oblast relačního úložiště open source pro Spark, kterou můžete použít k implementaci architektury datového jezera v Azure Databricks.

Azure Databricks poskytuje SQL Warehouse, které datovým analytikům umožňují pracovat s daty pomocí známých relačních dotazů SQL.

Použití kanálů v Azure Data Factory ke spouštění poznámkových bloků v Azure Databricks umožňuje automatizovat procesy přípravy dat v cloudovém měřítku.