Implementieren einer Datenanalyselösung mit Azure Databricks

Fortgeschrittene Anfänger
Datentechniker
Azure Databricks

Erfahren Sie, wie Sie die Leistungsfähigkeit von Apache Spark und leistungsstarke Cluster auf Basis der Azure Databricks-Plattform nutzen können, um große Data-Engineering-Workloads in der Cloud zu bewältigen.

Voraussetzungen

Keine

Module in diesem Lernpfad

Azure Databricks ist ein Clouddienst, der eine skalierbare Plattform für Datenanalysen mit Apache Spark bereitstellt.

Azure Databricks basiert auf Apache Spark und ermöglicht es Datentechniken und -Analysten, Spark-Aufträge auszuführen, um Datenmengen im großen Stil zu transformieren, zu analysieren und zu visualisieren.

Delta Lake ist ein relationaler Open-Source-Speicherbereich für Spark, den Sie für die Implementierung einer Data Lakehouse-Architektur in Azure Databricks verwenden können.

Azure Databricks stellt SQL Warehouses bereit, mit denen Datenanalysten mithilfe vertrauter relationaler SQL-Abfragen mit Daten arbeiten können.

Indem Sie Pipelines in Azure Data Factory verwenden, um Notebooks in Azure Databricks auszuführen, können Sie Datentechnikvorgänge im Cloudmaßstab automatisieren.