Compartir a través de


Conexión de Data Factory a Microsoft Purview

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Pruebe Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. Obtenga información sobre cómo iniciar una nueva evaluación gratuita.

Microsoft Purview es un servicio de gobernanza de datos unificado que le ayuda a administrar y controlar sus datos locales, multinube y de software como servicio (SaaS). Puede conectar su factoría de datos a Microsoft Purview. Esta conexión permite usar Microsoft Purview para capturar datos de linaje y detectar y explorar los recursos de Microsoft Purview.

Conexión de Data Factory a Microsoft Purview

Hay dos maneras de conectar Data Factory a Microsoft Purview:

Conexión de una cuenta de Microsoft Purview en Data Factory

Debe tener los roles Propietario o Colaborador en su factoría de datos para conectarse a una cuenta de Microsoft Purview. La factoría de datos debe tener habilitada la identidad administrada asignada por el sistema.

Para establecer la conexión en la interfaz de usuario de creación de Data Factory:

  1. En la UI de creación de ADF, vaya a Administrar ->Microsoft Purview y seleccione Connect to a Microsoft Purview account (Conectarse a una cuenta de Microsoft Purview).

    Screenshot for registering a Microsoft Purview account.

  2. Elija A partir de una suscripción de Azure o Especificar manualmente. En A partir de una suscripción de Azure, puede seleccionar la cuenta a la que tiene acceso.

  3. Una vez que se haya conectado, puede ver el nombre de la cuenta de Microsoft Purview en la pestaña Microsoft Purview account (Cuenta de Microsoft Purview).

Si la cuenta de Microsoft Purview la protege el firewall, cree los puntos de conexión privados administrados para Microsoft Purview. Obtenga más información sobre cómo permitir que Data Factory acceda a una cuenta de Microsoft Purview protegida. Puede hacerlo durante la conexión inicial o editar una conexión existente más adelante.

La información de conexión de Microsoft Purview se almacena en el recurso de la factoría de datos, como se muestra a continuación. Para establecer la conexión mediante programación, puede actualizar la factoría de datos y agregar la configuración purviewConfiguration. Si quiere insertar linaje de las actividades de SSIS, agregue también la etiqueta catalogUri.

{
    "name": "ContosoDataFactory",
    "type": "Microsoft.DataFactory/factories",
    "location": "<region>",
    "properties": {
        ...
        "purviewConfiguration": {
            "purviewResourceId": "/subscriptions/<subscriptionId>/resourceGroups/<resourceGroupname>/providers/Microsoft.Purview/accounts/<PurviewAccountName>"
        }
    },
    ...
    "identity": {...},
    "tags": {
        "catalogUri": "<PurviewAccountName>.purview.azure.com/catalog //Note: used for SSIS lineage only"
    }
}

Registro de Data Factory en Microsoft Purview

Para obtener información sobre cómo registrar Data Factory en Microsoft Purview, vea Procedimientos para conectar Azure Data Factory y Microsoft Purview.

Configuración de la autenticación

La identidad administrada de la factoría de datos se usa para autenticar las operaciones de inserción de linaje desde la factoría de datos a Microsoft Purview.

Conceda el rol de conservador de datos de la identidad administrada de la factoría de datos en la colección raíz de Microsoft Purview. Obtenga más información sobre el control de acceso en Microsoft Purview y la incorporación de roles y restricción del acceso mediante colecciones.

Al conectar la factoría de datos a Microsoft Purview en la interfaz de usuario de creación, ADF intenta agregar esta asignación de roles automáticamente. Si tiene el rol de administradores de colecciones en la colección raíz de Microsoft Purview y tiene acceso a la cuenta de Microsoft Purview desde la red, esta operación se realiza correctamente.

Supervisión de la conexión de Microsoft Purview

Una vez que conecte la factoría de datos a una cuenta de Microsoft Purview, verá la página siguiente con detalles sobre las capacidades de integración habilitadas.

Screenshot for monitoring the integration status between Azure Data Factory and Microsoft Purview.

En Data Lineage - Pipeline (Linaje de datos: canalización), es posible que vea uno de los siguientes estados:

  • Conectado: la factoría de datos está conectada correctamente a la cuenta de Microsoft Purview. Tenga en cuenta que esto indica que la factoría de datos está asociada a una cuenta de Microsoft Purview y que tiene permiso para insertar linaje en ella. Si la cuenta de Microsoft Purview está protegida mediante firewall, también debe asegurarse de que el entorno de ejecución de integración usado para ejecutar las actividades y realizar la inserción de linaje puede llegar a la cuenta de Microsoft Purview. Más información en Acceso a una cuenta protegida de Microsoft Purview desde Azure Data Factory.

  • Desconectado: la factoría de datos no puede insertar linaje en Microsoft Purview porque no se ha concedido el rol de administrador de datos de Microsoft Purview a la identidad administrada de la factoría de datos. Para corregir este problema, vaya a la cuenta de Microsoft Purview a fin de comprobar las asignaciones de roles y conceda manualmente el rol según sea necesario. Más información en la sección Configuración de la autenticación.

  • Desconocido: Data Factory no puede comprobar el estado. Los posibles motivos son:

    • No se puede acceder a la cuenta de Microsoft Purview desde la red actual porque la cuenta está protegida mediante firewall. Puede iniciar la interfaz de usuario de ADF desde una red privada que tenga conectividad con su cuenta de Microsoft Purview en su lugar.
    • No tiene permiso para comprobar las asignaciones de roles en la cuenta de Microsoft Purview. Puede ponerse en contacto con el administrador de la cuenta de Microsoft Purview para que compruebe las asignaciones de roles. Obtenga más información sobre el rol de Microsoft Purview necesario en la sección Configuración de la autenticación.

Notificación de datos de linaje a Microsoft Purview

Una vez que conecte la factoría de datos a una cuenta de Microsoft Purview, cuando ejecute las canalizaciones, la factoría de datos insertará la información de linaje a la cuenta de Microsoft Purview. Para obtener más información sobre las funcionalidades admitidas, consulte Actividades admitidas de Azure Data Factory. Para ver un tutorial completo, consulte Tutorial: Inserción de datos de linaje de Data Factory en Microsoft Purview.

Detección y exploración de datos mediante Microsoft Purview

Una vez conectada la factoría de datos a una cuenta de Microsoft Purview, puede usar la barra de búsqueda ubicada en la parte superior central de la interfaz de usuario de creación de Data Factory para buscar datos y realizar acciones. Para obtener más información, vea Detección y exploración de datos en ADF mediante Microsoft Purview.

Tutorial: Inserción de datos de linaje de Data Factory en Microsoft Purview

Detección y exploración de datos en ADF mediante Microsoft Purview

Acceso a una cuenta de Microsoft Purview protegida