Implémenter une solution d’analytique données avec Azure Databricks

Intermédiaire
Ingénieur Data
Azure Databricks

Apprenez comment exploiter la puissance d’Apache Spark et des clusters puissants fonctionnant sur la plateforme Azure Databricks pour exécuter des charges de travail d’ingénierie de données volumineuses dans le cloud.

Prérequis

Aucun

Modules de ce parcours d’apprentissage

Azure Databricks est un service cloud qui fournit une plateforme scalable pour l’analytique données à l’aide d’Apache Spark.

Azure Databricks repose sur Apache Spark et permet aux ingénieurs et analystes Données d’exécuter des travaux Spark pour transformer, analyser et visualiser des données à grande échelle.

Delta Lake est une zone de stockage relationnelle open source pour Spark que vous pouvez utiliser pour implémenter une architecture de data lakehouse dans Azure Databricks.

Azure Databricks fournit des entrepôts SQL qui permettent aux analystes Données de travailler avec des données en utilisant des requêtes SQL relationnelles connues.

L’utilisation de pipelines dans Azure Data Factory pour exécuter des notebooks dans Azure Databricks, vous pouvez automatiser les processus d’ingénierie de données à grande échelle dans le cloud.