Conexión a Azure Data Lake Gen1 en Microsoft Purview
En este artículo se describe el proceso para registrar un origen de datos de Azure Data Lake Storage Gen1 en Microsoft Purview, incluidas las instrucciones para autenticarse e interactuar con el origen Azure Data Lake Storage Gen1.
Nota:
Azure Data Lake Storage Gen2 ahora está disponible con carácter general. Se recomienda empezar a usarlo hoy mismo. Para obtener más información, consulte la página del producto.
Funciones admitidas
Extracción de metadatos | Examen completo | Examen incremental | Examen con ámbito | Clasificación | Etiquetar | Directiva de acceso | Linaje | Uso compartido de datos | Vista en vivo |
---|---|---|---|---|---|---|---|---|---|
Sí | Sí | Sí | Sí | Sí | Sí | No | Limitada** | No | No |
** El linaje se admite si el conjunto de datos se usa como origen o receptor en Data Factory actividad de copia
Requisitos previos
Una cuenta de Azure con una suscripción activa. Cree una cuenta de forma gratuita.
Una cuenta de Microsoft Purview activa.
Tendrá que ser administrador del origen de datos y lector de datos para registrar un origen y administrarlo en el portal de gobernanza de Microsoft Purview. Consulte nuestra página Permisos de Microsoft Purview para obtener más información.
Registrarse
Esta sección le permitirá registrar el origen de datos de ADLS Gen1 y configurar un mecanismo de autenticación adecuado para garantizar el examen correcto del origen de datos.
Pasos para registrarse
Es importante registrar el origen de datos en Microsoft Purview antes de configurar un examen para el origen de datos.
Abra el portal de gobernanza de Microsoft Purview:
- Vaya directamente a https://web.purview.azure.com la cuenta de Microsoft Purview y selecciónela.
- Abra el Azure Portal, busque y seleccione la cuenta de Microsoft Purview. Seleccione el botón del portal de gobernanza de Microsoft Purview .
Vaya al mapa de datos:> orígenes
Cree la jerarquía de colecciones mediante el menú Colecciones y asigne permisos a subcolecciones individuales, según sea necesario.
Vaya a la colección adecuada en el menú Orígenes y seleccione el icono Registrar para registrar un nuevo origen de datos de ADLS Gen1.
Seleccione el origen de datos Azure Data Lake Storage Gen1 y seleccione Continuar.
Proporcione un nombre adecuado para el origen de datos, seleccione la suscripción de Azure pertinente, el nombre de la cuenta de Data Lake Store existente y la colección y seleccione Aplicar.
La cuenta de almacenamiento de ADLS Gen1 se mostrará en la colección seleccionada.
Examinar
Requisitos previos para el examen
Para tener acceso para examinar el origen de datos, es necesario configurar un método de autenticación en la cuenta de almacenamiento de ADLS Gen1. Se admiten las siguientes opciones:
Nota:
Si tiene el firewall habilitado para la cuenta de almacenamiento, debe usar el método de autenticación de identidad administrada al configurar un examen.
Identidad administrada asignada por el sistema (recomendada): en cuanto se crea la cuenta de Microsoft Purview, se crea automáticamente una identidad administrada del sistema en el inquilino de Azure AD. En función del tipo de recurso, se requieren asignaciones de roles RBAC específicas para que el SAMI de Microsoft Purview realice los exámenes.
Identidad administrada asignada por el usuario (versión preliminar): de forma similar a una identidad administrada por el sistema, una identidad administrada asignada por el usuario es un recurso de credenciales que se puede usar para permitir que Microsoft Purview se autentique en Azure Active Directory. Para obtener más información, puede ver nuestra guía de identidad administrada asignada por el usuario.
Entidad de servicio: en este método, puede crear una nueva o usar una entidad de servicio existente en el inquilino de Azure Active Directory.
Autenticación para un examen
Uso de identidades administradas asignadas por el usuario o por el sistema para el examen
Es importante conceder a su cuenta de Microsoft Purview permiso para examinar el origen de datos de ADLS Gen1. Puede agregar la identidad administrada del sistema o la identidad administrada asignada por el usuario en el nivel suscripción, grupo de recursos o recurso, en función de en qué quiera que tenga permisos de examen.
Nota:
Debe ser propietario de la suscripción para poder agregar una identidad administrada en un recurso de Azure.
En el Azure Portal, busque la suscripción, el grupo de recursos o el recurso (por ejemplo, una cuenta de almacenamiento de Azure Data Lake Storage Gen1) que le gustaría permitir que el catálogo examinara.
Seleccione Información general y, a continuación, explorador de datos.
Seleccione Access (Acceso ) en el panel de navegación superior.
Elija Seleccionar y agregue el nombre de Microsoft Purview (que es la identidad administrada del sistema) o la identidad administrada asignada por el usuario (versión preliminar), que ya se ha registrado en Microsoft Purview, en el menú Seleccionar usuario o grupo .
Seleccione Permisos de lectura y ejecución . Asegúrese de elegir Esta carpeta y todos los elementos secundarios y Una entrada de permiso de acceso y una entrada de permiso predeterminada en las opciones Agregar, como se muestra en la captura de pantalla siguiente. Seleccione Aceptar.
Sugerencia
Una entrada de permiso de acceso es una entrada de permiso en archivos y carpetas actuales . Una entrada de permiso predeterminada es una entrada de permiso que heredarán los nuevos archivos y carpetas. Para conceder permiso solo a los archivos existentes actualmente, elija una entrada de permiso de acceso. Para conceder permiso para examinar archivos y carpetas que se agregarán en el futuro, incluya una entrada de permiso predeterminada.
Uso de la entidad de servicio para el examen
Creación de una nueva entidad de servicio
Si necesita crear una nueva entidad de servicio, es necesario registrar una aplicación en el inquilino de Azure AD y proporcionar acceso a la entidad de servicio en los orígenes de datos. El administrador global de Azure AD u otros roles, como administrador de aplicaciones, pueden realizar esta operación.
Obtención del identificador de aplicación de la entidad de servicio
Copie el identificador de aplicación (cliente) presente en información general de la entidad de servicio ya creada.
Concesión de acceso a la entidad de servicio a la cuenta de ADLS Gen1
Es importante conceder a la entidad de servicio permiso para examinar el origen de datos de ADLS Gen2. Puede agregar acceso para la entidad de servicio en el nivel suscripción, grupo de recursos o recurso, en función de los permisos que necesite.
Nota:
Debe ser propietario de la suscripción para poder agregar una entidad de servicio en un recurso de Azure.
Proporcione a la entidad de servicio acceso a la cuenta de almacenamiento; para ello, abra la cuenta de almacenamiento y seleccione Información general -->Data Explorer
Seleccione Access (Acceso ) en el panel de navegación superior.
Seleccione Seleccionar y Agregar la entidad de servicio en la selección Seleccionar usuario o grupo .
Seleccione Permisos de lectura y ejecución . Asegúrese de elegir Esta carpeta y todos los elementos secundarios y Una entrada de permiso de acceso y una entrada de permiso predeterminada en las opciones Agregar. Seleccione Aceptar.
Creación del examen
Abra la cuenta de Microsoft Purview y seleccione el portal de gobernanza de Microsoft Purview.
Vaya a Mapa de datos -->Sources para ver la jerarquía de recopilación.
Seleccione el icono Nuevo examen en el origen de datos de ADLS Gen1 registrado anteriormente.
Si se usa la identidad administrada asignada por el usuario o por el sistema
Proporcione un nombre para el examen, seleccione el sistema o la identidad administrada asignada por el usuario en Credencial, elija la colección adecuada para el examen y seleccione Probar conexión. En una conexión correcta, seleccione Continuar.
Si usa la entidad de servicio
Proporcione un nombre para el examen, elija la colección adecuada para el examen y seleccione + Nuevo en Credencial.
Seleccione la conexión de Key Vault adecuada y el nombre del secreto que se usó al crear la entidad de servicio. El identificador de entidad de servicio es el identificador de aplicación (cliente) copiado como se indicó anteriormente.
Seleccione Probar conexión. En una conexión correcta, seleccione Continuar.
Ámbito y ejecución del examen
Para limitar el examen a carpetas y subcarpetas específicas, elija los elementos adecuados de la lista.
A continuación, seleccione un conjunto de reglas de examen. Puede elegir entre los conjuntos de reglas personalizados predeterminados del sistema existentes o crear un nuevo conjunto de reglas alineado.
Si crea un nuevo conjunto de reglas de examen, seleccione los tipos de archivo que se incluirán en la regla de examen.
Puede seleccionar las reglas de clasificación que se incluirán en la regla de examen.
Elija el desencadenador de examen. Puede configurar una programación o ejecutar el examen una vez.
Revise el examen y seleccione Guardar y ejecutar.
Visualización del examen
Vaya al origen de datos de la colección y seleccione Ver detalles para comprobar el estado del examen.
Los detalles del examen indican el progreso del examen en el estado De última ejecución y el número de recursos examinados y clasificados
El estado De última ejecución se actualizará a En curso y, a continuación, se completará una vez que todo el examen se haya ejecutado correctamente.
Administración del examen
Los exámenes se pueden administrar o ejecutar de nuevo al finalizar.
Seleccione el nombre del examen para administrar el examen.
Puede volver a ejecutar el examen, editarlo, eliminar el examen.
Nota:
- La eliminación del examen no elimina los recursos de catálogo creados a partir de exámenes anteriores.
- El recurso ya no se actualizará con los cambios de esquema si la tabla de origen ha cambiado y vuelve a examinar la tabla de origen después de editar la descripción en la pestaña esquema de Microsoft Purview.
Puede ejecutar un examen incremental o un examen completo de nuevo.
Siguientes pasos
Ahora que ha registrado su origen, siga las guías siguientes para obtener más información sobre Microsoft Purview y sus datos.