Compartir a través de


Guía de estudio para el examen DP-203: Ingeniería de datos de Microsoft Azure

Advertencia

Este examen se retirará el 31 de marzo de 2025 a las 11:59 p. m. hora estándar central. Más información.

Finalidad de este documento

Esta guía de estudio le ayudará a comprender qué esperar en el examen, e incluye un resumen de los temas que el examen podría incluir y vínculos a recursos adicionales. La información y los materiales de este documento le ayudarán a centrar sus estudios a medida que se prepara para el examen.

Vínculos útiles Descripción
Obtención de la certificación Algunas certificaciones solo requieren aprobar un examen, mientras que otros requieren aprobar varios exámenes.
Renovación de la certificación Las certificaciones de asociado, experto y especialidad de Microsoft caducan anualmente. Puede renovar sus aptitudes aprobando una evaluación en línea gratuita en Microsoft Learn.
Su perfil de Microsoft Learn La conexión del perfil de certificación a Microsoft Learn le permite programar y renovar exámenes y compartir e imprimir certificados.
Puntuación de los exámenes e informes de puntuación Se requiere una puntuación de 700 o superior para aprobar.
Espacio aislado del examen Puede explorar el entorno del examen visitando nuestro espacio aislado del examen.
Solicitud de ajustes Si usa dispositivos de asistencia, requiere tiempo adicional o necesita modificaciones en cualquier parte de la experiencia del examen, puedes solicitar una adaptación.
Preséntese a una evaluación gratuita para practicar Practique y ponga a prueba sus conocimientos con preguntas que lo ayudarán a prepararse para el examen.

Actualizaciones al examen

Nuestros exámenes se actualizan periódicamente para reflejar las aptitudes necesarias para desempeñar un rol.

Siempre actualizamos la versión en inglés del examen primero. Algunos exámenes se localizan en otros idiomas y se actualizan aproximadamente ocho semanas después de actualizar la versión en inglés. Los otros idiomas disponibles se enumeran en la sección Schedule Exam (Programar examen) de la página web Exam Details (Detalles del examen). Si el examen no está disponible en su idioma de preferencia, puede solicitar un período adicional de 30 minutos para completarlo.

Nota

Las viñetas debajo de cada una de las aptitudes medidas están diseñadas para ilustrar cómo estamos evaluando esa aptitud. Los temas relacionados puede que se traten en el examen.

Nota

La mayoría de las preguntas tratan las características que son de disponibilidad general (GA). El examen puede contener preguntas de Características en vista previa (GB) si dichas características se usan de forma regular.

Capacidades medidas el 24 de octubre de 2024

Perfil del público

Como candidato para este examen, debe ser experto en la materia para integrar, transformar y consolidar datos procedentes de varios sistemas de datos (tanto estructurados como no estructurados y de streaming) en un mismo esquema adecuado para la creación de soluciones de análisis.

Como ingeniero de datos de Azure, ayuda a las partes interesadas a comprender los datos a través de la exploración y crea y mantiene unas canalizaciones de procesamiento de datos seguras y compatibles mediante diferentes herramientas y técnicas. Usa varios marcos y servicios de datos de Azure para almacenar y generar conjuntos de datos depurados y mejorados para su análisis. Este almacén de datos se puede diseñar con diferentes patrones de arquitectura en función de los requisitos empresariales, incluidos los siguientes:

  • Almacenamiento de datos moderno (MDW, por sus siglas en inglés)

  • Macrodatos

  • Arquitectura de almacén de lago

Como ingeniero de datos de Azure, también ayuda a garantizar que la operacionalización de las canalizaciones de datos y los almacenes de datos son de alto rendimiento, eficientes, organizados y confiables, dado un conjunto específico de requisitos y restricciones empresariales. Ayuda a identificar y solucionar problemas operativos y de calidad de los datos. También diseña, implementa, supervisa y optimiza las plataformas de datos para admitir las canalizaciones de datos.

Como candidato para este examen, debe tener un conocimiento sólido de los lenguajes de procesamiento de datos, entre los que se incluyen:

  • SQL

  • Python

  • Scala

Debe comprender los patrones de procesamiento paralelo y arquitectura de datos. Debe ser experto en el uso de lo siguiente para crear soluciones de procesamiento de datos:

  • Azure Data Factory

  • Azure Synapse Analytics

  • Azure Stream Analytics

  • Azure Event Hubs

  • Azure Data Lake Storage

  • Azure Databricks

Aptitudes de un vistazo

  • Diseño e implementación del almacenamiento de datos (15-20 %)

  • Desarrollo del procesamiento de datos (40-45 %)

  • Protección, supervisión y optimización del almacenamiento y el procesamiento de datos (30-35 %)

Diseño e implementación del almacenamiento de datos (15-20 %)

Implementación de una estrategia de partición

  • Implementación de una estrategia de partición para los archivos

  • Implementación de una estrategia de partición para cargas de trabajo analíticas

  • Implementación de una estrategia de partición para cargas de trabajo de streaming

  • Implementación de una estrategia de partición para Azure Synapse Analytics

  • Identificación de cuándo se necesita crear particiones en Azure Data Lake Storage Gen2

Diseño e implementación de la capa de exploración de datos

  • Creación y ejecución de consultas mediante una solución de proceso que usa SQL sin servidor y clústeres de Spark

  • Recomendación e implementación de plantillas de bases de datos de Azure Synapse Analytics

  • Inserción de un linaje de datos nuevo o actualizado en Microsoft Purview

  • Examen y búsqueda de metadatos en el Catálogo de datos de Microsoft Purview

Desarrollo del procesamiento de datos (40-45 %)

Ingesta y transformación de datos

  • Diseño e implementación de cargas de datos incrementales

  • Transformación de datos mediante Apache Spark

  • Transformación de datos mediante Transact-SQL (T-SQL) en Azure Synapse Analytics

  • Ingesta y transformación de datos mediante canalizaciones de Azure Synapse o Azure Data Factory

  • Transformación de datos con Azure Stream Analytics

  • Limpieza de datos

  • Control de datos duplicados

  • Evitar datos duplicados mediante la opción de entrega exactamente una vez de Azure Stream Analytics

  • Control de datos que faltan

  • Control de datos que llegan tarde

  • División de los datos

  • Fragmentación de JSON

  • Codificar y descodificar datos

  • Configuración del control de errores para una transformación

  • Normalización y desnormalización de datos

  • Realización de análisis exploratorios de los datos

Desarrollo de una solución de procesamiento por lotes

  • Desarrollo de soluciones de procesamiento por lotes mediante Azure Data Lake Storage Gen2, Azure Databricks, Azure Synapse Analytics y Azure Data Factory

  • Uso de PolyBase para cargar datos en un grupo de SQL

  • Implementación de Azure Synapse Link y consulta de los datos replicados

  • Creación de canalizaciones de datos

  • Escalado de recursos

  • Configuración del tamaño del lote

  • Creación de pruebas para canalizaciones de datos

  • Integración de cuadernos de Jupyter o Python en una canalización de datos

  • Datos por lotes upsert

  • Reversión de los datos a un estado anterior

  • Configuración del control de excepciones

  • Configuración de la retención por lotes

  • Lectura y escritura en un lago delta

Desarrollo de una solución de procesamiento de flujos

  • Creación de una solución de procesamiento de flujos mediante Stream Analytics y Azure Event Hubs

  • Procesamiento de datos mediante el flujo estructurado de Spark

  • Creación de agregados con ventanas

  • Control del desfase del esquema

  • Procesamiento de datos de serie temporal

  • Procesamiento de datos en particiones

  • Procesamiento en una partición

  • Configuración de puntos de comprobación y marcas de agua durante el procesamiento

  • Escalado de recursos

  • Creación de pruebas para canalizaciones de datos

  • Optimización de las canalizaciones con fines analíticos o transaccionales

  • Control de las interrupciones

  • Configuración del control de excepciones

  • Datos de flujo upsert

  • Reproducción de datos de flujo archivados

  • Lectura y escritura en un lago delta

Administración de lotes y canalizaciones

  • Desencadenamiento de lotes

  • Control de cargas por lotes con errores

  • Validación de cargas por lotes

  • Administración de canalizaciones de datos en Azure Data Factory o Azure Synapse

  • Programación de canalizaciones de datos en Data Factory o Azure Synapse

  • Implementación del control de versiones para artefactos de canalización

  • Administración de trabajos de Spark en una canalización

Protección, supervisión y optimización del almacenamiento y el procesamiento de datos (30-35 %)

Implementación de la seguridad de datos

  • Implementación del enmascaramiento de datos

  • Cifrado de datos en reposo y en movimiento

  • Implementación de la seguridad de nivel de fila y de columna

  • Implementación del control de acceso basado en roles (RBAC) de Azure

  • Implementación de listas de control de acceso (ACL) de tipo POSIX para Data Lake Storage Gen2

  • Implementación de una directiva de retención de datos

  • Implementación de puntos de conexión seguros (privados y públicos)

  • Implementación de tokens de recursos en Azure Databricks

  • Carga de un objeto DataFrame con información confidencial

  • Escritura de datos cifrados en tablas o archivos Parquet

  • Administración de información confidencial

Supervisión del almacenamiento y el procesamiento de datos

  • Implementación del registro usado por Azure Monitor

  • Configuración de servicios de supervisión

  • Supervisión del procesamiento de flujos

  • Medición del rendimiento del movimiento de datos

  • Supervisión y actualización de estadísticas sobre los datos en un sistema

  • Supervisión del rendimiento de canalizaciones de datos

  • Medición del rendimiento de las consultas

  • Programación y supervisión de pruebas de canalización

  • Interpretación de métricas y registros de Azure Monitor

  • Implementación de una estrategia de alertas de canalización

Optimización y solución de problemas de almacenamiento y procesamiento de datos

  • Compactación de archivos pequeños

  • Control de la asimetría en los datos

  • Control del volcado de datos

  • Optimización de la administración de recursos

  • Optimización de consultas mediante indizadores

  • Optimización de consultas mediante la memoria caché

  • Solución de problemas de un trabajo de Spark con errores

  • Solución de problemas de una ejecución de canalización con errores, incluidas las actividades ejecutadas en servicios externos

Recursos de estudio

Le recomendamos que entrene y obtenga experiencia práctica antes de hacer el examen. Ofrecemos opciones de autoestudio y formación en el aula, así como vínculos a documentación, sitios de la comunidad y vídeos.

Recursos de estudio Vínculos a aprendizaje y documentación
Obtención de entrenamiento Elegir entre rutas de aprendizaje autodirigido y módulos o realizar un curso dirigido por un instructor
Localización de documentación Almacén de Azure Data Lake
Azure Synapse Analytics
Azure Databricks
Data Factory
Azure Stream Analytics
Event Hubs
Azure Monitor
Hacer una pregunta Microsoft Q&A | Microsoft Docs
Obtener soporte técnico de la comunidad Análisis en Azure | TechCommunity
Azure Synapse Analytics | TechCommunity
Seguimiento de Microsoft Learn Microsoft Learn: Microsoft Tech Community
Encontrar un vídeo Zona de preparación del examen
Exposición de datos
Examinar otros programas de Microsoft Learn

Registro de cambios

Clave para comprender la tabla: los grupos de temas (también conocidos como grupos funcionales) están en negrita, seguidos de los objetivos de cada grupo. La tabla es una comparación entre las dos versiones de las aptitudes de examen medidas y la tercera columna describe la extensión de los cambios.

Área de aptitudes anterior al 24 de octubre de 2024 Área de capacidades a partir del 24 de octubre de 2024 Cambio
Desarrollo del procesamiento de datos Desarrollo del procesamiento de datos Sin cambios
Ingesta y transformación de datos Ingesta y transformación de datos Secundaria