Implémenter une solution d’analytique données avec Azure Databricks

Parcours d’apprentissage
5 Modules

Intermédiaire

Ingénieur Data

Azure Databricks

Apprenez comment exploiter la puissance d’Apache Spark et des clusters puissants fonctionnant sur la plateforme Azure Databricks pour exécuter des charges de travail d’ingénierie de données volumineuses dans le cloud.

Prérequis

Aucun

Modules de ce parcours d’apprentissage

Explorer Azure Databricks

Azure Databricks est un service cloud qui fournit une plateforme scalable pour l’analytique données à l’aide d’Apache Spark.

Utiliser Apache Spark dans Azure Databricks

Azure Databricks repose sur Apache Spark et permet aux ingénieurs et analystes Données d’exécuter des travaux Spark pour transformer, analyser et visualiser des données à grande échelle.

Utiliser Delta Lake dans Azure Databricks

Delta Lake est une zone de stockage relationnelle open source pour Spark que vous pouvez utiliser pour implémenter une architecture de data lakehouse dans Azure Databricks.

Utiliser des entrepôts SQL dans Azure Databricks

Azure Databricks fournit des entrepôts SQL qui permettent aux analystes Données de travailler avec des données en utilisant des requêtes SQL relationnelles connues.

Exécuter des notebooks Azure Databricks avec Azure Data Factory

L’utilisation de pipelines dans Azure Data Factory pour exécuter des notebooks dans Azure Databricks, vous pouvez automatiser les processus d’ingénierie de données à grande échelle dans le cloud.