Guide d’étude pour l’examen DP-750 : Implémentation de solutions d’ingénierie des données à l’aide d’Azure Databricks

Objectif de ce document

Ce guide d’étude est destiné à vous aider à comprendre ce qu’il faut attendre de l’examen. Il inclut un résumé des sujets potentiellement couverts par l’examen ainsi que des liens vers des ressources supplémentaires. Aidez-vous des informations et des supports fournis dans ce document pour savoir ce que vous devez étudier afin de vous préparer à l’examen.

Liens utiles Description
Comment obtenir la certification Certaines certifications nécessitent un seul examen, tandis que d’autres en nécessitent plusieurs.
renouvellement de certification Les certifications Microsoft Associate, Expert et Specialty expirent chaque année. Vous pouvez renouveler en réussissant une évaluation en ligne gratuite sur Microsoft Learn.
Votre profil Microsoft Learn En connectant votre profil de certification à Microsoft Learn, vous pouvez planifier et renouveler des examens, mais aussi partager et imprimer des certificats.
Notation des examens et relevés de notes Pour réussir l’examen, vous devez obtenir un score de 700 ou plus.
Bac à sable de l’examen Vous pouvez explorer l’environnement d’examen en visitant notre environnement de test.
Demander des aménagements Si vous utilisez des appareils d’assistance, si vous avez besoin de temps supplémentaire ou si vous souhaitez un quelconque changement dans n’importe quelle partie de l’examen, vous pouvez faire une demande d’aménagement.
Effectuer une évaluation gratuite des pratiques Testez vos compétences avec des questions pratiques qui vous aideront à vous préparer à l’examen.

À propos de l’examen

Langues

Certains examens sont disponibles dans d’autres langues et sont mis à jour environ huit semaines après la mise à jour de la version anglaise. Si l’examen n’est pas disponible dans la langue de votre choix, vous pouvez demander un temps supplémentaire de 30 minutes pour passer l’examen.

Note

Les puces sous chacune des compétences mesurées visent à illustrer notre façon d’évaluer cette compétence. Des sujets connexes peuvent être abordés dans l’examen.

Note

La plupart des questions concernent des fonctionnalités qui sont en disponibilité générale (GA). L’examen peut comporter des questions sur des fonctionnalités en préversion si ces fonctionnalités sont couramment utilisées.

Compétences mesurées le 11 mars 2026

Profil du public

En tant que candidat à cette certification Microsoft, vous devez avoir une expertise en matière d’intégration et de modélisation des données, de création et de déploiement de pipelines optimisés, ainsi que de résolution et de maintenance des charges de travail dans Azure Databricks. Vous devez également avoir de l’expérience en appliquant les meilleures pratiques de qualité des données et de gouvernance des données dans le catalogue Unity.

Vous devez savoir comment ingérer et transformer des données à l’aide du langage SQL (Structured Query Language) et de Python. Vous avez besoin d’une expérience avec les pratiques de cycle de vie du développement logiciel (SDLC), notamment Git. En outre, vous devez être familiarisé avec Microsoft Entra, Azure Data Factory et Azure Monitor.

Vos responsabilités pour ce rôle sont les suivantes :

  • Mise en place et configuration d’un environnement Azure Databricks.

  • Sécuriser et gouverner les objets du catalogue Unity.

  • Préparation et traitement des données.

  • Déploiement et maintenance des pipelines de données et des charges de travail.

Vous travaillez en étroite collaboration avec les administrateurs, les architectes de plateforme, les architectes de solutions, les scientifiques des données et les analystes de données pour concevoir, déployer et sécuriser des solutions d’ingénierie des données à l’aide d’Azure Databricks.

Compétences en un clin d’œil

  • Mettre en place et configurer un environnement Azure Databricks (15 à 20 %)

  • Sécuriser et régir les objets catalogue Unity (15 à 20%)

  • Préparer et traiter des données (30 à 35%)

  • Déployer et gérer des pipelines de données et des charges de travail (30 à 35%)

Mettre en place et configurer un environnement Azure Databricks (15 à 20 %)

Sélectionner et configurer le calcul dans un espace de travail

  • Choisir un type de calcul approprié, notamment le calcul de jobs, le calcul serverless, l'entrepôt de données, le calcul classique et le calcul partagé

  • Configurer les paramètres de performances de calcul, notamment le processeur, le nombre de nœuds, la mise à l’échelle automatique, l’arrêt, le type de nœud, la taille du cluster et le regroupement

  • Configurer les paramètres des fonctionnalités de calcul, notamment l’accélération Photon, le runtime Azure Databricks/Spark et le Machine Learning

  • Installer des bibliothèques pour une ressource de calcul

  • Configurer les autorisations d’accès à une ressource de calcul

Créer et organiser des objets dans le catalogue Unity

  • Appliquer des conventions d’affectation de noms en fonction des exigences, notamment l’isolation, l’environnement de développement et le partage externe

  • Créer un catalogue en fonction des exigences

  • Créer un schéma en fonction des exigences

  • Créer des volumes en fonction des exigences

  • Créer des tables, des vues et des vues matérialisées

  • Implémenter un catalogue étranger en configurant des connexions

  • Implémenter des opérations de langage de définition de données (DDL) sur des tables managées et externes

  • Configurer les instructions AI/BI Genie pour la découverte de données

Sécuriser et régir les objets catalogue Unity (15 à 20%)

Sécuriser les objets catalogue Unity

  • Accorder des privilèges à un principal (utilisateur, principal de service ou groupe) pour les objets sécurisables dans le catalogue Unity

  • Implémenter le contrôle d’accès au niveau des tables et des colonnes et la sécurité au niveau des lignes

  • Accéder aux secrets Azure Key Vault à partir d’Azure Databricks

  • Authentifier l'accès aux données à l'aide d'entités de service

  • Authentifier l’accès aux ressources à l’aide d’identités managées

Gouverner les objets du catalogue Unity

  • Créer, implémenter et conserver des définitions de table et de colonne et des descriptions pour la découverte de données

  • Configurer le contrôle d’accès en fonction des attributs (ABAC) à l’aide de balises et de stratégies

  • Configurer des filtres de lignes et des masques de colonne

  • Appliquer des stratégies de rétention des données

  • Configurer et gérer le suivi de la lignée des données à l’aide de l’Explorateur de Catalogue, y compris le propriétaire, l’historique, les dépendances et la lignée

  • Configurer la journalisation d’audit

  • Concevoir et implémenter une stratégie sécurisée pour le partage Delta

Préparer et traiter des données (30 à 35%)

Concevoir et implémenter la modélisation des données dans le catalogue Unity

  • Logique de conception pour l’ingestion de données et la configuration de source de données, y compris le type d’extraction et le type de fichier

  • Choisir un outil d’ingestion de données approprié, notamment Lakeflow Connect, notebooks et Azure Data Factory

  • Choisir une méthode de chargement de données, y compris le traitement par lots et la diffusion en continu

  • Choisir un format de table de données, tel que Parquet, Delta, CSV, JSON ou Iceberg

  • Concevoir et implémenter un schéma de partitionnement de données

  • Choisir un type de dimension à variation lente (SCD)

  • Choisir une granularité sur une colonne ou une table en fonction des exigences

  • Concevoir et implémenter une table temporelle (historique) pour enregistrer les modifications au fil du temps

  • Concevoir et implémenter une stratégie de clustering, y compris le clustering liquide, l’ordre Z et les vecteurs de suppression

  • Choisir entre les tables managées et non managées

Ingérer des données dans le catalogue Unity

  • Ingérer des données à l’aide de Lakeflow Connect, y compris le traitement par lots et la diffusion en continu

  • Ingérez des données à l’aide de notebooks, aussi bien en traitement par lots qu’en flux

  • Ingérer des données à l’aide de méthodes SQL, notamment CREATE TABLE ... AS (CTAS), CREATE OR REPLACE TABLE et COPY INTO

  • Ingérer des données à l’aide d’un flux de capture des changements de données (flux CDC)

  • Ingérer des données à l’aide de Spark Structured Streaming

  • Ingérer des données de streaming à partir d’Azure Event Hubs

  • Ingérez des données à l’aide des pipelines déclaratifs Lakeflow Spark, y compris Auto Loader

Nettoyer, transformer et charger des données dans le catalogue Unity

  • Profiler les données pour générer des statistiques récapitulatives et évaluer les distributions de données

  • Choisir les types de données de colonne appropriés

  • Identifier et résoudre les valeurs dupliquées, manquantes et null

  • Transformer des données, notamment le filtrage, le regroupement et l’agrégation des données

  • Transformez les données au moyen des opérateurs join, union, intersect et except

  • Transformer des données en dénormalisant, en pivotant et en dépivotant les données

  • Charger des données à l’aide des opérations de fusion, d’insertion et d’ajout

Implémenter et gérer des contraintes de qualité des données dans le catalogue Unity

  • Implémenter des vérifications de validation, notamment la nullabilité, la cardinalité des données et la vérification de plage

  • Implémenter des vérifications de type de données

  • Implémenter le respect du schéma et gérer la dérive de schéma

  • Assurez la qualité des données grâce aux attentes de pipeline dans les pipelines déclaratifs Lakeflow Spark

Déployer et gérer des pipelines de données et des charges de travail (30 à 35%)

Concevoir et implémenter des pipelines de données

  • Ordre de conception des opérations pour un pipeline de données

  • Sélectionnez entre les notebooks et les pipelines déclaratifs Lakeflow Spark

  • Conception de la logique de tâche pour les jobs Lakeflow

  • Concevez et mettez en œuvre la gestion des erreurs dans les pipelines de données, les notebooks et les tâches

  • Créez un pipeline de données à l’aide d’un notebook, y compris la gestion des contraintes de priorité

  • Créez un pipeline de données au moyen des pipelines déclaratifs Lakeflow Spark

Mettre en œuvre les tâches Lakeflow

  • Créer une tâche, y compris le paramétrage et la configuration

  • Configurer des déclencheurs de travail

  • Planifier un travail

  • Configurer des alertes pour un travail

  • Configurer des redémarrages automatiques pour un travail ou un pipeline de données

Implémenter des processus de cycle de vie de développement dans Azure Databricks

  • Appliquer les meilleures pratiques de contrôle de version à l’aide de Git

  • Gestion des branches, des pull requests et de la résolution des conflits

  • Implémenter une stratégie de test, notamment des tests unitaires, des tests d’intégration, des tests de bout en bout et des tests d’acceptation utilisateur (UAT)

  • Configurer et empaqueter des bundles de ressources Databricks

  • Déployer un bundle à l’aide de l’interface de ligne de commande Azure Databricks (CLI)

  • Déployer un bundle à l’aide d’API REST

Surveiller, dépanner et optimiser les charges de travail dans Azure Databricks

  • Surveiller et gérer la consommation de cluster pour optimiser les performances et les coûts

  • Résoudre et réparer les problèmes dans les tâches Lakeflow, notamment la réparation, le redémarrage, l’arrêt et l’exécution des tâches.

  • Diagnostiquez et résolvez les problèmes dans les tâches et les notebooks Apache Spark, notamment l’optimisation des performances, l’élimination des goulets d’étranglement liés aux ressources et le redémarrage du cluster

  • Examiner et résoudre les problèmes de mise en cache, de déséquilibrage, de déversement et de shuffle à l’aide d’un graphe acyclique dirigé (DAG), de l’interface utilisateur Spark et du profil de requête.

  • Optimiser les tables Delta pour les performances et les coûts, y compris les commandes OPTIMIZE et VACUUM

  • Mettez en œuvre le streaming des journaux à l’aide de l’analytique des journaux d’activité dans Azure Monitor

  • Configurer des alertes à l’aide d’Azure Monitor

Ressources de l’étude

Nous vous recommandons de vous entraîner et d’acquérir une expérience pratique avant de passer l’examen. Nous offrons des options d’auto-apprentissage, des formations en salle de classe ainsi que des liens vers de la documentation, des sites communautaires et des vidéos.

Ressources de l’étude Liens vers les ressources d’apprentissage et la documentation
Recevez une formation Choisissez des parcours et des modules d’apprentissage auto-rythmés ou suivez un cours dispensé par un instructeur
Rechercher de la documentation Azure Databricks
Azure Data Factory.
Microsoft Entra
Azure Monitor.
Poser une question Microsoft Q& A | Microsoft Docs
Bénéficier du support de la communauté Analytique sur Azure - Microsoft Tech Community
Azure Databricks - Community Hub
Suivre Microsoft Learn Microsoft Learn - Microsoft Tech Community
Trouver une vidéo Zone de préparation aux examens
Données exposées
Parcourir d’autres émissions Microsoft Learn