Conexión a Azure Data Lake Gen1 en Microsoft Purview

En este artículo se describe el proceso para registrar un origen de datos de Azure Data Lake Storage Gen1 en Microsoft Purview, incluidas las instrucciones para autenticarse e interactuar con el origen Azure Data Lake Storage Gen1.

Nota:

Azure Data Lake Storage Gen2 ahora está disponible con carácter general. Se recomienda empezar a usarlo hoy mismo. Para obtener más información, consulte la página del producto.

Funciones admitidas

Extracción de metadatos Examen completo Examen incremental Examen con ámbito Clasificación Etiquetar Directiva de acceso Linaje Uso compartido de datos Vista en vivo
No Limitada** No No

** El linaje se admite si el conjunto de datos se usa como origen o receptor en Data Factory actividad de copia

Requisitos previos

Registrarse

Esta sección le permitirá registrar el origen de datos de ADLS Gen1 y configurar un mecanismo de autenticación adecuado para garantizar el examen correcto del origen de datos.

Pasos para registrarse

Es importante registrar el origen de datos en Microsoft Purview antes de configurar un examen para el origen de datos.

  1. Abra el portal de gobernanza de Microsoft Purview:

  2. Vaya al mapa de datos:> orígenes

    Captura de pantalla que muestra el vínculo para abrir el portal de gobernanza de Microsoft Purview

    Captura de pantalla que navega al vínculo Orígenes en el mapa de datos

  3. Cree la jerarquía de colecciones mediante el menú Colecciones y asigne permisos a subcolecciones individuales, según sea necesario.

    Captura de pantalla que muestra el menú de recopilación para crear la jerarquía de recopilación

  4. Vaya a la colección adecuada en el menú Orígenes y seleccione el icono Registrar para registrar un nuevo origen de datos de ADLS Gen1.

    Captura de pantalla que muestra la colección usada para registrar el origen de datos

  5. Seleccione el origen de datos Azure Data Lake Storage Gen1 y seleccione Continuar.

    Captura de pantalla que permite seleccionar el origen de datos

  6. Proporcione un nombre adecuado para el origen de datos, seleccione la suscripción de Azure pertinente, el nombre de la cuenta de Data Lake Store existente y la colección y seleccione Aplicar.

    Captura de pantalla que muestra los detalles que se especificarán para registrar el origen de datos

  7. La cuenta de almacenamiento de ADLS Gen1 se mostrará en la colección seleccionada.

    Captura de pantalla que muestra el origen de datos asignado a la colección para iniciar el examen

Examinar

Requisitos previos para el examen

Para tener acceso para examinar el origen de datos, es necesario configurar un método de autenticación en la cuenta de almacenamiento de ADLS Gen1. Se admiten las siguientes opciones:

Nota:

Si tiene el firewall habilitado para la cuenta de almacenamiento, debe usar el método de autenticación de identidad administrada al configurar un examen.

  • Identidad administrada asignada por el sistema (recomendada): en cuanto se crea la cuenta de Microsoft Purview, se crea automáticamente una identidad administrada del sistema en el inquilino de Azure AD. En función del tipo de recurso, se requieren asignaciones de roles RBAC específicas para que el SAMI de Microsoft Purview realice los exámenes.

  • Identidad administrada asignada por el usuario (versión preliminar): de forma similar a una identidad administrada por el sistema, una identidad administrada asignada por el usuario es un recurso de credenciales que se puede usar para permitir que Microsoft Purview se autentique en Azure Active Directory. Para obtener más información, puede ver nuestra guía de identidad administrada asignada por el usuario.

  • Entidad de servicio: en este método, puede crear una nueva o usar una entidad de servicio existente en el inquilino de Azure Active Directory.

Autenticación para un examen

Uso de identidades administradas asignadas por el usuario o por el sistema para el examen

Es importante conceder a su cuenta de Microsoft Purview permiso para examinar el origen de datos de ADLS Gen1. Puede agregar la identidad administrada del sistema o la identidad administrada asignada por el usuario en el nivel suscripción, grupo de recursos o recurso, en función de en qué quiera que tenga permisos de examen.

Nota:

Debe ser propietario de la suscripción para poder agregar una identidad administrada en un recurso de Azure.

  1. En el Azure Portal, busque la suscripción, el grupo de recursos o el recurso (por ejemplo, una cuenta de almacenamiento de Azure Data Lake Storage Gen1) que le gustaría permitir que el catálogo examinara.

  2. Seleccione Información general y, a continuación, explorador de datos.

    Captura de pantalla que muestra la cuenta de almacenamiento

  3. Seleccione Access (Acceso ) en el panel de navegación superior.

    Captura de pantalla que muestra el Explorador de datos de la cuenta de almacenamiento

  4. Elija Seleccionar y agregue el nombre de Microsoft Purview (que es la identidad administrada del sistema) o la identidad administrada asignada por el usuario (versión preliminar), que ya se ha registrado en Microsoft Purview, en el menú Seleccionar usuario o grupo .

  5. Seleccione Permisos de lectura y ejecución . Asegúrese de elegir Esta carpeta y todos los elementos secundarios y Una entrada de permiso de acceso y una entrada de permiso predeterminada en las opciones Agregar, como se muestra en la captura de pantalla siguiente. Seleccione Aceptar.

    Captura de pantalla que muestra los detalles para asignar permisos para la cuenta de Microsoft Purview

Sugerencia

Una entrada de permiso de acceso es una entrada de permiso en archivos y carpetas actuales . Una entrada de permiso predeterminada es una entrada de permiso que heredarán los nuevos archivos y carpetas. Para conceder permiso solo a los archivos existentes actualmente, elija una entrada de permiso de acceso. Para conceder permiso para examinar archivos y carpetas que se agregarán en el futuro, incluya una entrada de permiso predeterminada.

Uso de la entidad de servicio para el examen

Creación de una nueva entidad de servicio

Si necesita crear una nueva entidad de servicio, es necesario registrar una aplicación en el inquilino de Azure AD y proporcionar acceso a la entidad de servicio en los orígenes de datos. El administrador global de Azure AD u otros roles, como administrador de aplicaciones, pueden realizar esta operación.

Obtención del identificador de aplicación de la entidad de servicio
  1. Copie el identificador de aplicación (cliente) presente en información general de la entidad de servicio ya creada.

    Captura de pantalla que muestra el identificador de aplicación (cliente) de la entidad de servicio

Concesión de acceso a la entidad de servicio a la cuenta de ADLS Gen1

Es importante conceder a la entidad de servicio permiso para examinar el origen de datos de ADLS Gen2. Puede agregar acceso para la entidad de servicio en el nivel suscripción, grupo de recursos o recurso, en función de los permisos que necesite.

Nota:

Debe ser propietario de la suscripción para poder agregar una entidad de servicio en un recurso de Azure.

  1. Proporcione a la entidad de servicio acceso a la cuenta de almacenamiento; para ello, abra la cuenta de almacenamiento y seleccione Información general -->Data Explorer

    Captura de pantalla que muestra la cuenta de almacenamiento

  2. Seleccione Access (Acceso ) en el panel de navegación superior.

    Captura de pantalla que muestra el Explorador de datos de la cuenta de almacenamiento

  3. Seleccione Seleccionar y Agregar la entidad de servicio en la selección Seleccionar usuario o grupo .

  4. Seleccione Permisos de lectura y ejecución . Asegúrese de elegir Esta carpeta y todos los elementos secundarios y Una entrada de permiso de acceso y una entrada de permiso predeterminada en las opciones Agregar. Seleccione Aceptar.

    Captura de pantalla que muestra los detalles para asignar permisos para la entidad de servicio

Creación del examen

  1. Abra la cuenta de Microsoft Purview y seleccione el portal de gobernanza de Microsoft Purview.

  2. Vaya a Mapa de datos -->Sources para ver la jerarquía de recopilación.

    Captura de pantalla que muestra la jerarquía de la colección

  3. Seleccione el icono Nuevo examen en el origen de datos de ADLS Gen1 registrado anteriormente.

    Captura de pantalla que muestra el origen de datos con el nuevo icono de examen

Si se usa la identidad administrada asignada por el usuario o por el sistema

Proporcione un nombre para el examen, seleccione el sistema o la identidad administrada asignada por el usuario en Credencial, elija la colección adecuada para el examen y seleccione Probar conexión. En una conexión correcta, seleccione Continuar.

Captura de pantalla que muestra la opción de identidad administrada para ejecutar el examen

Si usa la entidad de servicio

  1. Proporcione un nombre para el examen, elija la colección adecuada para el examen y seleccione + Nuevo en Credencial.

    Captura de pantalla que muestra la opción de entidad de servicio

  2. Seleccione la conexión de Key Vault adecuada y el nombre del secreto que se usó al crear la entidad de servicio. El identificador de entidad de servicio es el identificador de aplicación (cliente) copiado como se indicó anteriormente.

    Captura de pantalla que muestra la opción del almacén de claves de la entidad de servicio

  3. Seleccione Probar conexión. En una conexión correcta, seleccione Continuar.

    Captura de pantalla que muestra la conexión de prueba para la entidad de servicio

Ámbito y ejecución del examen

  1. Para limitar el examen a carpetas y subcarpetas específicas, elija los elementos adecuados de la lista.

    Ámbito del examen

  2. A continuación, seleccione un conjunto de reglas de examen. Puede elegir entre los conjuntos de reglas personalizados predeterminados del sistema existentes o crear un nuevo conjunto de reglas alineado.

    Conjunto de reglas de examen

  3. Si crea un nuevo conjunto de reglas de examen, seleccione los tipos de archivo que se incluirán en la regla de examen.

    Examinar tipos de archivo de conjunto de reglas

  4. Puede seleccionar las reglas de clasificación que se incluirán en la regla de examen.

    Reglas de clasificación del conjunto de reglas de examen

    Selección del conjunto de reglas de examen

  5. Elija el desencadenador de examen. Puede configurar una programación o ejecutar el examen una vez.

    Desencadenador de examen

    selección del desencadenador de examen

  6. Revise el examen y seleccione Guardar y ejecutar.

    examen de revisión

Visualización del examen

  1. Vaya al origen de datos de la colección y seleccione Ver detalles para comprobar el estado del examen.

    examen de vista

  2. Los detalles del examen indican el progreso del examen en el estado De última ejecución y el número de recursos examinados y clasificados

    ver detalles del examen

  3. El estado De última ejecución se actualizará a En curso y, a continuación, se completará una vez que todo el examen se haya ejecutado correctamente.

    visualización del examen en curso

    visualización del examen completado

Administración del examen

Los exámenes se pueden administrar o ejecutar de nuevo al finalizar.

  1. Seleccione el nombre del examen para administrar el examen.

    administrar examen

  2. Puede volver a ejecutar el examen, editarlo, eliminar el examen.

    administrar opciones de examen

    Nota:

    • La eliminación del examen no elimina los recursos de catálogo creados a partir de exámenes anteriores.
    • El recurso ya no se actualizará con los cambios de esquema si la tabla de origen ha cambiado y vuelve a examinar la tabla de origen después de editar la descripción en la pestaña esquema de Microsoft Purview.
  3. Puede ejecutar un examen incremental o un examen completo de nuevo.

    administrar el examen completo o incremental

    administrar los resultados del examen

Siguientes pasos

Ahora que ha registrado su origen, siga las guías siguientes para obtener más información sobre Microsoft Purview y sus datos.