Partajați prin


Ghid de studiu pentru Examen DP-203: Inginerie de date în Microsoft Azure

Avertisment

Acest examen a fost retras pe 31 martie 2025, la ora 11:59 ora standard central. Aflați mai multe.

Scopul acestui document

Acest ghid de studiu ar trebui să vă ajute să înțelegeți la ce să vă așteptați la examen și include un rezumat al subiectelor pe care le poate acoperi examenul și linkuri către resurse suplimentare. Informațiile și materialele din acest document ar trebui să vă ajute să vă concentrați studiile pe măsură ce vă pregătiți pentru examen.

Linkuri utile Descriere
Cum să obțineți certificarea Unele certificări necesită doar trecerea unui examen, în timp ce altele necesită trecerea mai multor examene.
de reînnoire a certificării Certificările Microsoft asociate, experte și speciale expiră anual. Puteți reînnoi prin trecerea unei evaluări online gratuite pe Microsoft Learn.
profilul dvs. Microsoft Learn Conectarea profilului de certificare la Microsoft Learn vă permite să planificați și să reînnoiți examenele și să partajați și să imprimați certificate.
rapoarte punctajelor și punctajelor examenului Este necesar un scor de 700 sau mai mare pentru a trece.
sandbox examen Puteți explora mediul de examen vizitând sandboxul examenului nostru.
Solicitați cazarea Dacă utilizați dispozitive de asistare, aveți nevoie de timp suplimentar sau aveți nevoie de modificări la orice parte a experienței examenului, puteți solicita o cazare.
De a lua o evaluare de practică gratuită Testați-vă abilitățile cu întrebări practice pentru a vă ajuta să vă pregătiți pentru examen.

Actualizări la examen

Examenele noastre sunt actualizate periodic pentru a reflecta abilitățile necesare pentru a efectua un rol.

Întotdeauna actualizăm mai întâi versiunea limbii engleze a examenului. Unele examene sunt localizate în alte limbi, iar acestea sunt actualizate la aproximativ opt săptămâni după actualizarea versiunii în limba engleză. Alte limbi disponibile sunt listate în secțiunea Program examen a paginii web Detalii examen . Dacă examenul nu este disponibil în limba preferată, puteți solicita încă 30 de minute pentru a finaliza examenul.

Notă

Marcatorii care urmează fiecare dintre abilități măsurate sunt menite să ilustreze modul în care evaluăm această abilitate. Subiectele asociate pot fi descrise în examen.

Notă

Majoritatea întrebărilor acoperă caracteristicile care sunt disponibilitate generală (GA). Examenul poate conține întrebări despre caracteristicile De previzualizare dacă aceste caracteristici sunt utilizate frecvent.

Abilități măsurate începând cu 24 octombrie 2024

Profil public

În calitate de candidat la acest examen, ar trebui să aveți experiență în materie în integrarea, transformarea și sintetizarea datelor din diverse sisteme structurate, nestructurate și redate în flux a datelor într-o schemă adecvată pentru soluții de analiză a clădirilor.

În calitate de inginer de date Azure, ajutați participanții direct interesați să înțeleagă datele prin explorare și să construiți și să mențineți canale de procesare a datelor sigure și conforme, utilizând diferite instrumente și tehnici. Utilizați diverse servicii și cadre de date Azure pentru a stoca și a produce seturi de date curățate și îmbunătățite pentru analiză. Acest depozit de date poate fi proiectat cu modele diferite de arhitectură, pe baza cerințelor de afaceri, inclusiv:

  • Depozit de date modern (MDW)

  • Date mari

  • Arhitectura lacului

În calitate de inginer de date Azure, vă ajutați, de asemenea, să vă asigurați că operaționalizarea canalelor de date și a depozitelor de date sunt de înaltă performanță, eficientă, organizată și fiabilă, având în vedere un set de cerințe și constrângeri de afaceri. Ajutați la identificarea și depanarea problemelor operaționale și de calitate a datelor. De asemenea, proiectați, implementați, monitorizați și optimizați platforme de date pentru a îndeplini ductoarele de date.

Ca candidat la acest examen, trebuie să aveți cunoștințe solide despre limbile de procesare a datelor, inclusiv:

  • SQL

  • Piton

  • Scala

Trebuie să înțelegeți modelele paralele de procesare și arhitectură de date. Ar trebui să fiți specialist în utilizarea următoarelor pentru a crea soluții de procesare a datelor:

  • Azure Data Factory

  • Azure Synapse Analytics

  • Azure Stream Analytics

  • Huburi de evenimente Azure

  • Azure Data Lake Storage

  • Azure Databricks

Abilități dintr-o privire

  • Proiectarea și implementarea stocării datelor (15-20%)

  • Dezvoltarea procesării datelor (40-45%)

  • Securizați, monitorizați și optimizați stocarea datelor și procesarea datelor (30-35%)

Proiectarea și implementarea stocării datelor (15-20%)

Implementarea unei strategii de partiție

  • Implementarea unei strategii de partiție pentru fișiere

  • Implementarea unei strategii de partiție pentru sarcinile de lucru analitice

  • Implementarea unei strategii de partiție pentru fluxurile de lucru în flux

  • Implementarea unei strategii de partiție pentru Azure Synapse Analytics

  • Identificați când este necesară partiționarea în Azure Data Lake Storage Gen2

Proiectarea și implementarea stratului de explorare a datelor

  • Crearea și executarea interogărilor utilizând o soluție de calcul care utilizează clustere SQL serverless și Spark

  • Recomandați și implementați șabloane de baze de date Azure Synapse Analytics

  • Legătura de date nouă sau actualizată către Microsoft Purview

  • Răsfoiți și căutați metadate în Catalogul de date Microsoft Purview

Dezvoltarea procesării datelor (40-45%)

Ingerarea și transformarea datelor

  • Proiectarea și implementarea încărcărilor incrementale de date

  • Transformarea datelor utilizând Apache Spark

  • Transformarea datelor utilizând Transact-SQL (T-SQL) în Azure Synapse Analytics

  • Ingerarea și transformarea datelor utilizând Azure Synapse Pipelines sau Azure Data Factory

  • Transformarea datelor utilizând Azure Stream Analytics

  • Curăță datele

  • Gestionați datele dublate

  • Evitarea datelor dublate utilizând Azure Stream Analytics exact după livrare

  • Gestionați datele lipsă

  • Gestionați datele care sosesc târziu

  • Scindarea datelor

  • JSON mărunțit

  • Codificarea și decodarea datelor

  • Configurarea gestionării erorilor pentru o transformare

  • Normalizarea și denormalizarea datelor

  • Efectuarea analizei exploratorului de date

Dezvoltarea unei soluții de procesare pe loturi

  • Dezvoltați soluții de procesare pe loturi utilizând Azure Data Lake Storage Gen2, Azure Databricks, Azure Synapse Analytics și Azure Data Factory

  • Utilizarea PolyBase pentru a încărca date într-un rezervor SQL

  • Implementați Azure Synapse Link și interogați datele reproduse

  • Crearea canalelor de date

  • Scalați resursele

  • Configurarea dimensiunii lotului

  • Crearea de teste pentru canale de date

  • Integrarea blocnotesurilor Jupyter sau Python într-un canal de date

  • Date lot upsert

  • Revenirea datelor la o stare anterioară

  • Configurarea gestionării excepțiilor

  • Configurare retenție pe loturi

  • Citiți de la și scrieți într-un lac delta

Dezvoltarea unei soluții de procesare flux

  • Creați o soluție de procesare a fluxului utilizând Stream Analytics și Huburile de evenimente Azure

  • Procesarea datelor utilizând redarea în flux structurată spark

  • Creare agregate fereastră

  • Handle schema drift

  • Se procesează datele seriei de timp

  • Procesați datele între partiții

  • Proces într-o singură partiție

  • Configurarea punctelor de verificare și a inscripționării în timpul procesării

  • Scalați resursele

  • Crearea de teste pentru canale de date

  • Optimizarea canalelor pentru scopuri analitice sau tranzacționale

  • Gestionați întreruperile

  • Configurarea gestionării excepțiilor

  • Date flux upsert

  • Reluarea datelor de flux arhivate

  • Citiți de la și scrieți într-un lac delta

Gestionarea loturilor și a canalelor

  • Seturi trigger

  • Handle failed batch loads

  • Validarea încărcărilor pe loturi

  • Gestionarea canalelor de date în Azure Data Factory sau Azure Synapse Pipelines

  • Planificarea canalelor de date în Data Factory sau Azure Synapse Pipelines

  • Implementați controlul versiunii pentru artefactele de canalizare

  • Gestionarea lucrărilor Spark într-o conductă

Securizați, monitorizați și optimizați stocarea datelor și procesarea datelor (30-35%)

Implementarea securității datelor

  • Implementați mascarea datelor

  • Criptarea datelor în repaus și în mișcare

  • Implementați securitatea la nivel de rând și la nivel de coloană

  • Implementarea controlului de acces bazat pe roluri Azure (RBAC)

  • Implementați liste de control al accesului posIX (ACL) pentru Data Lake Storage Gen2

  • Implementarea unei politici de retenție a datelor

  • Implementarea punctelor finale securizate (private și publice)

  • Implementarea tokenurilor de resurse în Azure Databricks

  • Încărcarea unui Cadru de date cu informații sensibile

  • Scrierea datelor criptate în tabele sau fișiere de parcheiere

  • Gestionarea informațiilor sensibile

Monitorizarea stocării datelor și a procesării datelor

  • Implementați înregistrarea în jurnal utilizată de Azure Monitor

  • Configurarea serviciilor de monitorizare

  • Procesare flux monitor

  • Măsurați performanța mișcării datelor

  • Monitorizarea și actualizarea statisticilor despre datele dintr-un sistem

  • Monitorizarea performanței canalului de date

  • Măsurați performanța interogării

  • Planificarea și monitorizarea testelor de canalizare

  • Interpretarea măsurătorilor și jurnalelor Azure Monitor

  • Implementarea unei strategii de avertizare privind canalizarea

Optimizarea și depanarea stocării și procesării datelor

  • Compactare fișiere mici

  • Handle skew in data

  • Gestionați vărsarea datelor

  • Optimizarea gestionării resurselor

  • Reglarea interogărilor utilizând indexatori

  • Reglarea interogărilor utilizând memoria cache

  • Depanarea unei activități Spark nereușită

  • Depanarea unei rulări a canalului nereușit, inclusiv activitățile executate în serviciile externe

Resurse de studiu

Vă recomandăm să vă instruiți și să beneficiați de experiență directă înainte de a trece la examen. Oferim opțiuni de auto-studiu și instruire în clasă, precum și linkuri către documentație, site-uri de comunitate și videoclipuri.

Resurse de studiu Linkuri către învățare și documentație
Instruiți-vă Alegeți dintre căile și modulele de învățare în ritm propriu sau urmați un curs condus de instructor
Găsiți documentația Azure Data Lake Storage
Azure Synapse Analytics
Azure Databricks
Data Factory
Azure Stream Analytics
Huburi de evenimente
Azure Monitor
Adresați o întrebare Întrebări și întrebări microsoft | Microsoft Docs
Obțineți asistență pentru comunitate Analytics pe Azure | TechCommunity
Azure Synapse Analytics | TechCommunity
Urmăriți Microsoft Learn Microsoft Learn - Comunitatea tehnică Microsoft
Găsirea unui videoclip zona de pregătire a examenului
date expuse
Navigați în alte microsoft Learn arată

Jurnal de modificări

Cheie pentru înțelegerea tabelului: Grupurile de subiecte (numite și grupuri funcționale) sunt în caractere aldine, urmate de obiectivele din cadrul fiecărui grup. Tabelul este o comparație între cele două versiuni ale abilităților de examen măsurate și a treia coloană descrie amploarea modificărilor.

Zonă de competențe înainte de 24 octombrie 2024 Zona de competențe începând cu 24 octombrie 2024 Schimbare
Dezvoltarea procesării datelor Dezvoltarea procesării datelor Nicio modificare
Ingerarea și transformarea datelor Ingerarea și transformarea datelor Minor