Implementace řešení analýzy dat pomocí Azure Databricks
Zjistěte, jak využít výkon Apache Spark a výkonné clustery běžící na platformě Azure Databricks ke spouštění rozsáhlých úloh v rámci přípravy dat v cloudu.
Požadavky
Nic
Kód dosaženého cíle
Chcete požádat o kód cíle?
Moduly v tomto studijním programu
Azure Databricks je cloudová služba, která poskytuje škálovatelnou platformu pro analýzu dat pomocí Apache Sparku.
Azure Databricks je založený na Apache Sparku a umožňuje datovým inženýrům a analytikům spouštět úlohy Sparku pro transformaci, analýzu a vizualizaci dat ve velkém měřítku.
Delta Lake je opensourcová oblast relačního úložiště pro Spark, kterou můžete použít k implementaci architektury datového jezera v Azure Databricks.
Azure Databricks poskytuje SQL Warehouse, které datovým analytikům umožňují pracovat s daty pomocí známých relačních dotazů SQL.
Použití kanálů ve službě Azure Data Factory ke spouštění poznámkových bloků v Azure Databricks umožňuje automatizovat procesy přípravy dat v cloudovém měřítku.