Guide d’étude pour l’examen DP-750 : Implémentation de solutions d’ingénierie des données à l’aide d’Azure Databricks

Objectif de ce document

Ce guide d’étude est destiné à vous aider à comprendre ce qu’il faut attendre de l’examen. Il inclut un résumé des sujets potentiellement couverts par l’examen ainsi que des liens vers des ressources supplémentaires. Aidez-vous des informations et des supports fournis dans ce document pour savoir ce que vous devez étudier afin de vous préparer à l’examen.

Liens utiles	Description
Comment obtenir la certification	Certaines certifications nécessitent un seul examen, tandis que d’autres en nécessitent plusieurs.
renouvellement de certification	Les certifications Microsoft Associate, Expert et Specialty expirent chaque année. Vous pouvez renouveler en réussissant une évaluation en ligne gratuite sur Microsoft Learn.
Votre profil Microsoft Learn	En connectant votre profil de certification à Microsoft Learn, vous pouvez planifier et renouveler des examens, mais aussi partager et imprimer des certificats.
Notation des examens et relevés de notes	Pour réussir l’examen, vous devez obtenir un score de 700 ou plus.
Bac à sable de l’examen	Vous pouvez explorer l’environnement d’examen en visitant notre environnement de test.
Demander des aménagements	Si vous utilisez des appareils d’assistance, si vous avez besoin de temps supplémentaire ou si vous souhaitez un quelconque changement dans n’importe quelle partie de l’examen, vous pouvez faire une demande d’aménagement.
Effectuer une évaluation gratuite des pratiques	Testez vos compétences avec des questions pratiques qui vous aideront à vous préparer à l’examen.

À propos de l’examen

Langues

Certains examens sont disponibles dans d’autres langues et sont mis à jour environ huit semaines après la mise à jour de la version anglaise. Si l’examen n’est pas disponible dans la langue de votre choix, vous pouvez demander un temps supplémentaire de 30 minutes pour passer l’examen.

Note

Les puces sous chacune des compétences mesurées visent à illustrer notre façon d’évaluer cette compétence. Des sujets connexes peuvent être abordés dans l’examen.

Note

La plupart des questions concernent des fonctionnalités qui sont en disponibilité générale (GA). L’examen peut comporter des questions sur des fonctionnalités en préversion si ces fonctionnalités sont couramment utilisées.

Compétences mesurées le 11 mars 2026

Profil du public

En tant que candidat à cette certification Microsoft, vous devez avoir une expertise en matière d’intégration et de modélisation des données, de création et de déploiement de pipelines optimisés, ainsi que de résolution et de maintenance des charges de travail dans Azure Databricks. Vous devez également avoir de l’expérience en appliquant les meilleures pratiques de qualité des données et de gouvernance des données dans le catalogue Unity.

Vous devez savoir comment ingérer et transformer des données à l’aide du langage SQL (Structured Query Language) et de Python. Vous avez besoin d’une expérience avec les pratiques de cycle de vie du développement logiciel (SDLC), notamment Git. En outre, vous devez être familiarisé avec Microsoft Entra, Azure Data Factory et Azure Monitor.

Vos responsabilités pour ce rôle sont les suivantes :

Mise en place et configuration d’un environnement Azure Databricks.
Sécuriser et gouverner les objets du catalogue Unity.
Préparation et traitement des données.
Déploiement et maintenance des pipelines de données et des charges de travail.

Vous travaillez en étroite collaboration avec les administrateurs, les architectes de plateforme, les architectes de solutions, les scientifiques des données et les analystes de données pour concevoir, déployer et sécuriser des solutions d’ingénierie des données à l’aide d’Azure Databricks.

Compétences en un clin d’œil

Mettre en place et configurer un environnement Azure Databricks (15 à 20 %)
Sécuriser et régir les objets catalogue Unity (15 à 20%)
Préparer et traiter des données (30 à 35%)
Déployer et gérer des pipelines de données et des charges de travail (30 à 35%)

Mettre en place et configurer un environnement Azure Databricks (15 à 20 %)

Sélectionner et configurer le calcul dans un espace de travail

Choisir un type de calcul approprié, notamment le calcul de jobs, le calcul serverless, l'entrepôt de données, le calcul classique et le calcul partagé
Configurer les paramètres de performances de calcul, notamment le processeur, le nombre de nœuds, la mise à l’échelle automatique, l’arrêt, le type de nœud, la taille du cluster et le regroupement
Configurer les paramètres des fonctionnalités de calcul, notamment l’accélération Photon, le runtime Azure Databricks/Spark et le Machine Learning
Installer des bibliothèques pour une ressource de calcul
Configurer les autorisations d’accès à une ressource de calcul

Créer et organiser des objets dans le catalogue Unity

Appliquer des conventions d’affectation de noms en fonction des exigences, notamment l’isolation, l’environnement de développement et le partage externe
Créer un catalogue en fonction des exigences
Créer un schéma en fonction des exigences
Créer des volumes en fonction des exigences
Créer des tables, des vues et des vues matérialisées
Implémenter un catalogue étranger en configurant des connexions
Implémenter des opérations de langage de définition de données (DDL) sur des tables managées et externes
Configurer les instructions AI/BI Genie pour la découverte de données

Sécuriser et régir les objets catalogue Unity (15 à 20%)

Sécuriser les objets catalogue Unity

Accorder des privilèges à un principal (utilisateur, principal de service ou groupe) pour les objets sécurisables dans le catalogue Unity
Implémenter le contrôle d’accès au niveau des tables et des colonnes et la sécurité au niveau des lignes
Accéder aux secrets Azure Key Vault à partir d’Azure Databricks
Authentifier l'accès aux données à l'aide d'entités de service
Authentifier l’accès aux ressources à l’aide d’identités managées

Gouverner les objets du catalogue Unity

Créer, implémenter et conserver des définitions de table et de colonne et des descriptions pour la découverte de données
Configurer le contrôle d’accès en fonction des attributs (ABAC) à l’aide de balises et de stratégies
Configurer des filtres de lignes et des masques de colonne
Appliquer des stratégies de rétention des données
Configurer et gérer le suivi de la lignée des données à l’aide de l’Explorateur de Catalogue, y compris le propriétaire, l’historique, les dépendances et la lignée
Configurer la journalisation d’audit
Concevoir et implémenter une stratégie sécurisée pour le partage Delta

Préparer et traiter des données (30 à 35%)

Concevoir et implémenter la modélisation des données dans le catalogue Unity

Logique de conception pour l’ingestion de données et la configuration de source de données, y compris le type d’extraction et le type de fichier
Choisir un outil d’ingestion de données approprié, notamment Lakeflow Connect, notebooks et Azure Data Factory
Choisir une méthode de chargement de données, y compris le traitement par lots et la diffusion en continu
Choisir un format de table de données, tel que Parquet, Delta, CSV, JSON ou Iceberg
Concevoir et implémenter un schéma de partitionnement de données
Choisir un type de dimension à variation lente (SCD)
Choisir une granularité sur une colonne ou une table en fonction des exigences
Concevoir et implémenter une table temporelle (historique) pour enregistrer les modifications au fil du temps
Concevoir et implémenter une stratégie de clustering, y compris le clustering liquide, l’ordre Z et les vecteurs de suppression
Choisir entre les tables managées et non managées

Ingérer des données dans le catalogue Unity

Ingérer des données à l’aide de Lakeflow Connect, y compris le traitement par lots et la diffusion en continu
Ingérez des données à l’aide de notebooks, aussi bien en traitement par lots qu’en flux
Ingérer des données à l’aide de méthodes SQL, notamment CREATE TABLE ... AS (CTAS), CREATE OR REPLACE TABLE et COPY INTO
Ingérer des données à l’aide d’un flux de capture des changements de données (flux CDC)
Ingérer des données à l’aide de Spark Structured Streaming
Ingérer des données de streaming à partir d’Azure Event Hubs
Ingérez des données à l’aide des pipelines déclaratifs Lakeflow Spark, y compris Auto Loader

Nettoyer, transformer et charger des données dans le catalogue Unity

Profiler les données pour générer des statistiques récapitulatives et évaluer les distributions de données
Choisir les types de données de colonne appropriés
Identifier et résoudre les valeurs dupliquées, manquantes et null
Transformer des données, notamment le filtrage, le regroupement et l’agrégation des données
Transformez les données au moyen des opérateurs join, union, intersect et except
Transformer des données en dénormalisant, en pivotant et en dépivotant les données
Charger des données à l’aide des opérations de fusion, d’insertion et d’ajout

Implémenter et gérer des contraintes de qualité des données dans le catalogue Unity

Implémenter des vérifications de validation, notamment la nullabilité, la cardinalité des données et la vérification de plage
Implémenter des vérifications de type de données
Implémenter le respect du schéma et gérer la dérive de schéma
Assurez la qualité des données grâce aux attentes de pipeline dans les pipelines déclaratifs Lakeflow Spark

Déployer et gérer des pipelines de données et des charges de travail (30 à 35%)

Concevoir et implémenter des pipelines de données

Ordre de conception des opérations pour un pipeline de données
Sélectionnez entre les notebooks et les pipelines déclaratifs Lakeflow Spark
Conception de la logique de tâche pour les jobs Lakeflow
Concevez et mettez en œuvre la gestion des erreurs dans les pipelines de données, les notebooks et les tâches
Créez un pipeline de données à l’aide d’un notebook, y compris la gestion des contraintes de priorité
Créez un pipeline de données au moyen des pipelines déclaratifs Lakeflow Spark

Mettre en œuvre les tâches Lakeflow

Créer une tâche, y compris le paramétrage et la configuration
Configurer des déclencheurs de travail
Planifier un travail
Configurer des alertes pour un travail
Configurer des redémarrages automatiques pour un travail ou un pipeline de données

Implémenter des processus de cycle de vie de développement dans Azure Databricks

Appliquer les meilleures pratiques de contrôle de version à l’aide de Git
Gestion des branches, des pull requests et de la résolution des conflits
Implémenter une stratégie de test, notamment des tests unitaires, des tests d’intégration, des tests de bout en bout et des tests d’acceptation utilisateur (UAT)
Configurer et empaqueter des bundles de ressources Databricks
Déployer un bundle à l’aide de l’interface de ligne de commande Azure Databricks (CLI)
Déployer un bundle à l’aide d’API REST

Surveiller, dépanner et optimiser les charges de travail dans Azure Databricks

Surveiller et gérer la consommation de cluster pour optimiser les performances et les coûts
Résoudre et réparer les problèmes dans les tâches Lakeflow, notamment la réparation, le redémarrage, l’arrêt et l’exécution des tâches.
Diagnostiquez et résolvez les problèmes dans les tâches et les notebooks Apache Spark, notamment l’optimisation des performances, l’élimination des goulets d’étranglement liés aux ressources et le redémarrage du cluster
Examiner et résoudre les problèmes de mise en cache, de déséquilibrage, de déversement et de shuffle à l’aide d’un graphe acyclique dirigé (DAG), de l’interface utilisateur Spark et du profil de requête.
Optimiser les tables Delta pour les performances et les coûts, y compris les commandes OPTIMIZE et VACUUM
Mettez en œuvre le streaming des journaux à l’aide de l’analytique des journaux d’activité dans Azure Monitor
Configurer des alertes à l’aide d’Azure Monitor

Ressources de l’étude

Nous vous recommandons de vous entraîner et d’acquérir une expérience pratique avant de passer l’examen. Nous offrons des options d’auto-apprentissage, des formations en salle de classe ainsi que des liens vers de la documentation, des sites communautaires et des vidéos.

Ressources de l’étude	Liens vers les ressources d’apprentissage et la documentation
Recevez une formation	Choisissez des parcours et des modules d’apprentissage auto-rythmés ou suivez un cours dispensé par un instructeur
Rechercher de la documentation	Azure Databricks Azure Data Factory. Microsoft Entra Azure Monitor.
Poser une question	Microsoft Q& A \| Microsoft Docs
Bénéficier du support de la communauté	Analytique sur Azure - Microsoft Tech Community Azure Databricks - Community Hub
Suivre Microsoft Learn	Microsoft Learn - Microsoft Tech Community
Trouver une vidéo	Zone de préparation aux examens Données exposées Parcourir d’autres émissions Microsoft Learn

Last updated on 2026-03-11

Guide d’étude pour l’examen DP-750 : Implémentation de solutions d’ingénierie des données à l’aide d’Azure Databricks

Objectif de ce document

À propos de l’examen

Langues

Note

Note

Compétences mesurées le 11 mars 2026

Profil du public

Compétences en un clin d’œil

Mettre en place et configurer un environnement Azure Databricks (15 à 20 %)

Sélectionner et configurer le calcul dans un espace de travail

Créer et organiser des objets dans le catalogue Unity

Sécuriser et régir les objets catalogue Unity (15 à 20%)

Sécuriser les objets catalogue Unity

Gouverner les objets du catalogue Unity

Préparer et traiter des données (30 à 35%)

Concevoir et implémenter la modélisation des données dans le catalogue Unity

Ingérer des données dans le catalogue Unity

Nettoyer, transformer et charger des données dans le catalogue Unity

Implémenter et gérer des contraintes de qualité des données dans le catalogue Unity

Déployer et gérer des pipelines de données et des charges de travail (30 à 35%)

Concevoir et implémenter des pipelines de données

Mettre en œuvre les tâches Lakeflow

Implémenter des processus de cycle de vie de développement dans Azure Databricks

Surveiller, dépanner et optimiser les charges de travail dans Azure Databricks

Ressources de l’étude

Ressources supplémentaires