Seguimiento del linaje de datos en las canalizaciones

Completado

En una solución de análisis a gran escala típica, los datos se transfieren y transforman en varios sistemas hasta que se cargan en un almacén de datos analíticos para los informes y los análisis. El seguimiento del linaje de los datos a medida que se mueven por la empresa es un factor importante para determinar la procedencia, confiabilidad y la antigüedad de los recursos de datos en los que se basan los análisis y las tomas de decisiones.

Generación y visualización de la información de linaje de datos

En Azure Synapse Analytics, el movimiento y la transformación de datos se administran mediante canalizaciones, que constan de un conjunto orquestado de actividades que operan en los datos. Los temas del diseño y la implementación de canalizaciones son demasiado amplios para tratarlos en profundidad en este módulo, pero un punto clave que tener en cuenta es que hay dos tipos de actividad disponibles en las canalizaciones de Synapse Analytics que generan automáticamente información de linaje de datos en un catálogo de Purview conectado:

  • La actividad Copiar datos
  • La actividad Data Flow

La ejecución de una canalización que incluya cualquiera de estas actividades en un área de trabajo con una cuenta de Purview conectada dará lugar a la creación o actualización de recursos de datos con información de linaje. Los recursos registrados incluyen:

  • El origen del que se extraen los datos.
  • La actividad utilizada para transferir los datos.
  • El destino donde se almacenan los datos.

En el portal de gobernanza de Microsoft Purview puede abrir los recursos en el catálogo de Purview y ver la información de linaje como se muestra aquí:

A screenshot of a data asset in Purview, showing the lineage tab.

También puede ver el linaje de una actividad de canalización en Synapse Studio.

Sugerencia

Para más información sobre el seguimiento del linaje de datos para canalizaciones de Azure Synapse Analytics en Microsoft Purview, consulte Procedimiento para obtener el linaje de Azure Synapse Analytics en Microsoft Purview.

Podrá generar y ver el linaje de datos desde una canalización de Synapse Analytics en el ejercicio que se presenta más adelante en este módulo.