Inżynieria danych przy użyciu usługi Azure Databricks

Średni
Inżynier danych
Databricks

Dowiedz się, jak wykorzystać możliwości platformy Apache Spark i zaawansowane klastry działające na platformie Azure Databricks do uruchamiania dużych obciążeń inżynieryjnych danych w chmurze.

Wymagania wstępne

Brak

Moduły w ramach tej ścieżki szkoleniowej

Azure Databricks to usługa w chmurze, która zapewnia skalowalną platformę do analizy danych przy użyciu platformy Apache Spark.

Usługa Azure Databricks jest oparta na platformie Apache Spark i umożliwia inżynierom danych i analitykom uruchamianie zadań platformy Spark w celu przekształcania, analizowania i wizualizowania danych na dużą skalę.

Usługa Delta Lake to open source obszar magazynu relacyjnego dla platformy Spark, którego można użyć do zaimplementowania architektury usługi Data Lakehouse w usłudze Azure Databricks.

Usługa Azure Databricks udostępnia usługi SQL Warehouse, które umożliwiają analitykom danych pracę z danymi przy użyciu znanych zapytań relacyjnych SQL.

Używanie potoków w Azure Data Factory do uruchamiania notesów w usłudze Azure Databricks umożliwia automatyzowanie procesów inżynierii danych na dużą skalę chmury.