Compartir a través de


Linaje de datos

El linaje de datos desempeña un papel importante en el análisis a escala de nube. El linaje muestra las dependencias entre los datos sin procesar y los productos terminados, que describe las transformaciones y manipulaciones que convierten esos datos sin procesar en los productos de datos finales. Ayuda a las organizaciones a comprender la calidad de los datos y a validar el cumplimiento. También agrega contexto a conjuntos de datos y productos que permiten a productos de datos ser detectables y de autoservicio.

Un elemento principal de cualquier catálogo de datos es su capacidad para mostrar el linaje entre los productos de datos. Azure Purview admite la captura del linaje de datos de tres actividades de Azure Data Factory:

  • Copia de datos
  • Flujo de datos
  • Ejecutar paquetes SSIS

Además de este informe de linaje nativo, Azure Purview también permite informes de linaje personalizados a través de enlaces de Apache Atlas o API REST.

Diagrama de linaje de datos.

Importante

Las canalizaciones de Azure Data Factory y Azure Synapse se recomiendan para las soluciones de ingesta porque habilitan el linaje de datos en Azure Purview. Patrones alternativos de ingesta deben usar la API de Apache Atlas para actualizar el linaje de datos como parte de su procesamiento de datos.

Linaje de datos de Azure Purview

Una de las características de la plataforma de Azure Purview es la capacidad de mostrar el linaje entre conjuntos de datos que hayan creado procesos de datos. Sistemas como Data Factory, Data Share y Power BI capturan el linaje de los datos a medida que se transfieren. También puede obtener informes de linaje personalizados a través de los enlaces de Atlas y API REST.

Sugerencia

Para más información sobre los sistemas admitidos y los procedimientos recomendados, consulte la Guía del usuario del linaje de Microsoft Purview Data Catalog.

Pasos siguientes

Aprenda a administrar datos maestros en Azure.