Inżynieria danych przy użyciu usługi Azure Databricks
Dowiedz się, jak wykorzystać możliwości platformy Apache Spark i zaawansowane klastry działające na platformie Azure Databricks do uruchamiania dużych obciążeń inżynieryjnych danych w chmurze.
Wymagania wstępne
Brak
Moduły w ramach tej ścieżki szkoleniowej
Azure Databricks to usługa w chmurze, która zapewnia skalowalną platformę do analizy danych przy użyciu platformy Apache Spark.
Usługa Azure Databricks jest oparta na platformie Apache Spark i umożliwia inżynierom danych i analitykom uruchamianie zadań platformy Spark w celu przekształcania, analizowania i wizualizowania danych na dużą skalę.
Usługa Delta Lake to obszar magazynu relacyjnego typu open source dla platformy Spark, którego można użyć do zaimplementowania architektury usługi Data Lakehouse w usłudze Azure Databricks.
Usługa Azure Databricks udostępnia usługi SQL Warehouse, które umożliwiają analitykom danych pracę z danymi przy użyciu znanych zapytań relacyjnych SQL.
Używanie potoków w usłudze Azure Data Factory do uruchamiania notesów w usłudze Azure Databricks umożliwia automatyzowanie procesów inżynierii danych w skali chmury.