Implementace řešení analýzy dat pomocí Azure Databricks

Středně pokročilý
Data Engineer
Azure Databricks

Naučte se využívat výkon Apache Sparku a výkonných clusterů běžících na platformě Azure Databricks ke spouštění úloh analýzy dat v datovém jezeře.

Požadavky

Nic

Moduly v tomto studijním programu

Azure Databricks je cloudová služba, která poskytuje škálovatelnou platformu pro analýzu dat pomocí Apache Sparku.

Azure Databricks je založený na Apache Sparku a umožňuje datovým inženýrům a analytikům spouštět úlohy Sparku pro transformaci, analýzu a vizualizaci dat ve velkém měřítku.

Delta Lake je opensourcová oblast relačního úložiště pro Spark, kterou můžete použít k implementaci architektury datového jezera v Azure Databricks.

Azure Databricks poskytuje SQL Warehouse, které datovým analytikům umožňují pracovat s daty pomocí známých relačních dotazů SQL.

Použití kanálů ve službě Azure Data Factory ke spouštění poznámkových bloků v Azure Databricks umožňuje automatizovat procesy přípravy dat v cloudovém měřítku.