Studiehandleiding voor examen DP-750: Data Engineering-oplossingen implementeren met behulp van Azure Databricks

Doel van dit document

Deze studiegids helpt u inzicht te krijgen in wat u kunt verwachten op het examen en bevat een overzicht van de onderwerpen die het examen kan behandelen en koppelingen naar aanvullende bronnen. Met de informatie en materialen in dit document kunt u zich concentreren op uw studies terwijl u zich voorbereidt op het examen.

Nuttige koppelingen Beschrijving
Hoe je de certificering kunt behalen Voor sommige certificeringen is slechts één examen vereist, terwijl voor andere certificeringen meerdere examens zijn vereist.
certificeringsvernieuwing Microsoft-medewerkers, experts en speciale certificeringen verlopen jaarlijks. U kunt uw certificering verlengen door een gratis online evaluatie af te leggen op Microsoft Learn.
Uw Microsoft Learn-profiel Door uw certificeringsprofiel aan Microsoft Learn te koppelen, kunt u examens plannen en vernieuwen en certificaten delen en afdrukken.
Beoordeling van examens en scorerapporten Een score van 700 of hoger is vereist om te slagen.
Examenzandbak U kunt de examenomgeving verkennen door naar onze examen-sandbox te gaan.
Accommodaties aanvragen Als u ondersteunende apparaten gebruikt, extra tijd nodig hebt of een deel van de examenervaring moet wijzigen, kunt u een accommodatie aanvragen.
Neem deel aan een gratis oefentoets Test uw vaardigheden met oefenvragen om u voor te bereiden op het examen.

Over het examen

Talen

Sommige examens worden gelokaliseerd in andere talen en die worden ongeveer acht weken na het bijwerken van de Engelse versie bijgewerkt. Als het examen niet beschikbaar is in uw voorkeurstaal, kunt u een extra 30 minuten aanvragen om het examen te voltooien.

Opmerking

De opsommingstekens die volgen op elk van de vaardigheden die worden gemeten, zijn bedoeld om te illustreren hoe we die vaardigheid beoordelen. Verwante onderwerpen kunnen worden behandeld in het examen.

Opmerking

De meeste vragen hebben betrekking op functies die algemene beschikbaarheid (GA) zijn. Het examen kan vragen bevatten over preview-functies als deze functies vaak worden gebruikt.

Vaardigheden gemeten vanaf 11 maart 2026

Doelgroepprofiel

Als kandidaat voor deze Microsoft-certificering moet u expertise hebben op het gebied van het integreren en modelleren van gegevens, het bouwen en implementeren van geoptimaliseerde pijplijnen en het oplossen en onderhouden van workloads in Azure Databricks. U moet ook ervaring hebben met het toepassen van best practices voor gegevenskwaliteit en gegevensbeheer in Unity Catalog.

U moet weten hoe u gegevens opneemt en transformeert met behulp van SQL (Structured Query Language) en Python. U hebt ervaring nodig met sdLC-procedures (softwareontwikkelingslevenscyclus), waaronder Git. Daarnaast moet u bekend zijn met Microsoft Entra, Azure Data Factory en Azure Monitor.

Uw verantwoordelijkheden voor deze rol zijn onder andere:

  • Een Azure Databricks-omgeving instellen en configureren.

  • Unity Catalog-objecten beveiligen en beheren.

  • Gegevens voorbereiden en verwerken.

  • Gegevenspijplijnen en -workloads implementeren en onderhouden.

U werkt nauw samen met beheerders, platformarchitecten, oplossingsarchitecten, gegevenswetenschappers en gegevensanalisten om oplossingen voor data engineering te ontwerpen, implementeren en beveiligen met behulp van Azure Databricks.

Vaardigheden in één oogopslag

  • Een Azure Databricks-omgeving instellen en configureren (15-20%)

  • Unity Catalog-objecten beveiligen en beheren (15-20%)

  • Gegevens voorbereiden en verwerken (30-35%)

  • Gegevenspijplijnen en -workloads implementeren en onderhouden (30-35%)

Een Azure Databricks-omgeving instellen en configureren (15-20%)

Rekenkracht selecteren en configureren in een werkruimte

  • Kies een geschikt rekentype, inclusief taak berekenen, serverloos, magazijn, klassieke rekenkracht en gedeelde rekenkracht

  • Instellingen voor rekenprestaties configureren, waaronder CPU, aantal knooppunten, automatisch schalen, beëindiging, knooppunttype, clustergrootte en pooling

  • Instellingen voor rekenfuncties configureren, waaronder Photon-versnelling, Azure Databricks Runtime/Spark-versie en machine learning

  • Bibliotheken voor een rekenresource installeren

  • Toegangsmachtigingen voor een rekenresource configureren

Objecten maken en organiseren in Unity Catalog

  • Naamconventies toepassen op basis van vereisten, waaronder isolatie, ontwikkelomgeving en extern delen

  • Een catalogus maken op basis van vereisten

  • Een schema maken op basis van vereisten

  • Volumes maken op basis van vereisten

  • Maak tabellen, weergaven en gematerialiseerde weergaven

  • Configureer verbindingen om een buitenlandse catalogus te implementeren

  • DDL-bewerkingen (Data Definition Language) implementeren in beheerde en externe tabellen

  • AI/BI Genie-instructies configureren voor dataverkenning

Unity Catalog-objecten beveiligen en beheren (15-20%)

Secure Unity Catalog-objecten

  • Bevoegdheden verlenen aan een principal (gebruiker, service-principal of groep) voor beveiligbare objecten in Unity Catalog

  • Toegangsbeheer op tabel- en kolomniveau en beveiliging op rijniveau implementeren

  • Toegang tot Azure Key Vault-geheimen vanuit Azure Databricks

  • Gegevenstoegang verifiëren met behulp van service-principals

  • Resourcetoegang verifiëren met behulp van beheerde identiteiten

Unity Catalog-objecten beheren

  • Tabel- en kolomdefinities en -beschrijvingen maken, implementeren en behouden voor gegevensdetectie

  • Op kenmerken gebaseerd toegangsbeheer (ABAC) configureren met behulp van tags en beleid

  • Rijfilters en kolommaskers configureren

  • Beleid voor gegevensretentie toepassen

  • Gegevenslijnage instellen en beheren met behulp van Catalog Explorer, waaronder eigenaar, geschiedenis, afhankelijkheden en lijnage

  • Auditlogboekregistratie configureren

  • Een veilige strategie ontwerpen en implementeren voor Delta Sharing

Gegevens voorbereiden en verwerken (30-35%)

Gegevensmodellering ontwerpen en implementeren in Unity Catalog

  • Ontwerplogica voor gegevensopname en configuratie van gegevensbronnen, inclusief extractietype en bestandstype

  • Kies een geschikt hulpprogramma voor gegevensopname, waaronder Lakeflow Connect, notebooks en Azure Data Factory

  • Kies een methode voor het laden van gegevens, inclusief batch en streaming

  • Kies een gegevenstabelindeling, zoals Parquet, Delta, CSV, JSON of Iceberg

  • Een schema voor gegevenspartitionering ontwerpen en implementeren

  • Een scd-type (langzaam veranderende dimensie) kiezen

  • Granulariteit kiezen voor een kolom of tabel op basis van vereisten

  • Een tijdelijke tabel (geschiedenis) ontwerpen en implementeren om wijzigingen in de loop van de tijd vast te leggen

  • Een clusteringstrategie ontwerpen en implementeren, waaronder liquide clustering, Z-volgorde en verwijderingsvectoren

  • Kiezen tussen beheerde en niet-beheerde tabellen

Gegevens opnemen in Unity Catalog

  • Gegevens opnemen met behulp van Lakeflow Connect, inclusief batch- en streaming

  • Gegevens opnemen door notebooks te gebruiken, inclusief batch- en streaming.

  • Gegevens opnemen met behulp van SQL-methoden, waaronder CREATE TABLE ... AS (CTAS), CREATE OR REPLACE TABLE, en COPY INTO

  • Gegevens opnemen met een Change Data Capture-feed (CDC)

  • Gegevens opnemen met behulp van Spark Structured Streaming

  • Streaminggegevens opnemen vanuit Azure Event Hubs

  • Gegevens opnemen met behulp van declaratieve pijplijnen van Lakeflow Spark, waaronder automatisch laden

Gegevens opschonen, transformeren en laden in Unity Catalog

  • Profielgegevens voor het genereren van overzichtsstatistieken en het evalueren van gegevensdistributies

  • De juiste kolomgegevenstypen kiezen

  • Dubbele, ontbrekende en null-waarden identificeren en oplossen

  • Gegevens transformeren, waaronder filteren, groeperen en aggregeren van gegevens

  • Gegevens transformeren door het gebruik van join, union, intersect en except operators.

  • Gegevens transformeren door te denormaliseren, pivoteren en te depivoteren.

  • Gegevens laden met bewerkingen voor samenvoegen, invoegen en toevoegen

Beperkingen voor gegevenskwaliteit implementeren en beheren in Unity Catalog

  • Validatiecontroles implementeren, inclusief nullwaardigheid, gegevenskardinaliteit en bereikcontroles

  • Controles van gegevenstypen implementeren

  • Schemadwinging implementeren en schemadrift beheren

  • Gegevenskwaliteit beheren met pijplijnverwachtingen in Lakeflow Spark-declaratieve pijplijnen

Gegevenspijplijnen en -workloads implementeren en onderhouden (30-35%)

Gegevenspijplijnen ontwerpen en implementeren

  • De volgorde van bewerkingen voor een gegevenspijplijn ontwerpen

  • Kiezen tussen notebook- en Lakeflow Spark-declaratieve pijplijnen

  • Taaklogica ontwerpen voor Lakeflow-taken

  • Foutafhandeling ontwerpen en implementeren in gegevenspijplijnen, notebooks en taken

  • Een gegevenspijplijn maken met behulp van een notebook, inclusief prioriteitsbeperkingen

  • Een gegevenspijplijn maken met behulp van Lakeflow Spark-declaratieve pijplijnen

Lakeflow-taken implementeren

  • Een taak maken, inclusief installatie en configuratie

  • Taaktriggers configureren

  • Een taak plannen

  • Waarschuwingen voor een taak configureren

  • Automatische herstarts configureren voor een taak of een gegevenspijplijn

Ontwikkelingslevenscyclusprocessen implementeren in Azure Databricks

  • Best practices voor versiebeheer toepassen met Git

  • Vertakkingen, pull-aanvragen en conflictoplossing beheren

  • Een teststrategie implementeren, waaronder eenheidstests, integratietests, end-to-end tests en UAT (User Acceptance Testing)

  • Databricks-Assetbundels configureren en verpakken

  • Een bundel implementeren met behulp van de Azure Databricks-opdrachtregelinterface (CLI)

  • Een bundel implementeren met behulp van REST API's

Workloads bewaken, oplossen en optimaliseren in Azure Databricks

  • Clusterverbruik bewaken en beheren om de prestaties en kosten te optimaliseren

  • Problemen in Lakeflow-taken oplossen en herstellen, waaronder reparatie, opnieuw opstarten, stoppen en uitvoeren van functies

  • Problemen oplossen en herstellen in Apache Spark-taken en -notebooks, waaronder het afstemmen van prestaties, het oplossen van knelpunten in resources en het opnieuw opstarten van het cluster

  • Problemen met caching, skewing, spilling en shuffle onderzoeken en oplossen met behulp van een Gerichte Acyclische Graaf (DAG), de Spark-gebruikersinterface en het queryprofiel.

  • Delta-tabellen optimaliseren voor prestaties en kosten, inclusief OPTIMIZE- en VACUUM-opdrachten

  • Logboekstreaming implementeren met behulp van Log Analytics in Azure Monitor

  • Waarschuwingen configureren met behulp van Azure Monitor

Studiehulpmiddelen

We raden u aan om praktijkervaring op te doen voordat u het examen gaat afleggen. We bieden zelfstudieopties en leslokaaltrainingen, evenals koppelingen naar documentatie, communitysites en video's.

Studiehulpmiddelen Koppelingen naar leren en documentatie
Training ontvangen Kies uit leertrajecten en modules in eigen tempo of volg een door een docent geleide cursus
Documentatie zoeken Azure Databricks
Azure Data Factory
Microsoft Entra
Azure Monitor
Stel een vraag Microsoft Q&A | Microsoft Docs
Ondersteuning voor de community krijgen Analytics op Azure - Microsoft Tech Community
Azure Databricks - Community Hub
Microsoft Learn volgen Microsoft Learn - Microsoft Tech Community
Een video zoeken Gereedheidszone voor examens
Weergegeven gegevens
Andere Microsoft Learn-afleveringen bekijken