Implémenter une solution d’analytique données avec Azure Databricks
Apprenez comment exploiter la puissance d’Apache Spark et des clusters puissants fonctionnant sur la plateforme Azure Databricks pour exécuter des charges de travail d’ingénierie de données volumineuses dans le cloud.
Prérequis
Aucun
Code de réussite
Souhaitez-vous demander un code de réussite ?
Modules de ce parcours d’apprentissage
Azure Databricks est un service cloud qui fournit une plateforme scalable pour l’analytique données à l’aide d’Apache Spark.
Azure Databricks repose sur Apache Spark et permet aux ingénieurs et analystes Données d’exécuter des travaux Spark pour transformer, analyser et visualiser des données à grande échelle.
Delta Lake est une zone de stockage relationnelle open source pour Spark que vous pouvez utiliser pour implémenter une architecture de data lakehouse dans Azure Databricks.
Azure Databricks fournit des entrepôts SQL qui permettent aux analystes Données de travailler avec des données en utilisant des requêtes SQL relationnelles connues.
L’utilisation de pipelines dans Azure Data Factory pour exécuter des notebooks dans Azure Databricks, vous pouvez automatiser les processus d’ingénierie de données à grande échelle dans le cloud.