Azure Data Lake Storage Gen2 conector de Microsoft Graph

El conector Azure Data Lake Storage Gen2 Microsoft Graph permite a los usuarios de su organización buscar archivos almacenados en cuentas de almacenamiento de Azure Blob Storage y Azure Data Lake Gen 2.

Nota:

Lea el artículo Configuración del conector de Microsoft Graph para conocer las instrucciones generales de configuración de los conectores.

Este artículo está destinado a cualquier persona que configure, ejecute y supervise un conector de Azure Data Lake Storage Gen2. Complementa el proceso de configuración general y muestra instrucciones que solo se aplican al conector de Azure Data Lake Storage Gen2. En este artículo también se incluye información sobre las limitaciones.

En el artículo, usamos Azure Storage como término genérico para Azure Blob Storage y Azure Data Lake Gen 2 Storage.

Paso 1: Agregar un conector en el Centro de administración de Microsoft 365

Agregar conector de Azure Data Lake Storage Gen2

(Consulte las instrucciones generales de configuración para obtener más detalles)

Paso 2: Asignar un nombre a la conexión

Siga las instrucciones generales de configuración.

Paso 3: Configurar las opciones de conexión

Escriba el cadena de conexión de almacenamiento principal. Esta cadena es necesaria para permitir el acceso a la cuenta de almacenamiento. Para buscar la cadena de conexión, vaya a la Azure Portal y vaya a la sección Claves de la cuenta de Azure Storage correspondiente.

Si prefiere no proporcionar AccountKey (un parámetro en el cadena de conexión de almacenamiento principal), conceda acceso al servicio de conectores de Microsoft Graph para los siguientes roles:

  • Lector de datos de Storage Blob
  • Colaborador de datos de cola de storage
  • Delegado de blobs de Storage

Vaya a la pestaña Access Control de la cuenta de Azure Storage y siga las instrucciones para conceder acceso a la siguiente aplicación:

  • Id. de aplicación de primera entidad: 56c1da01-2129-48f7-9355-af6d59d42766
  • Nombre de la aplicación de primera entidad: Servicio graph connector

Notificaciones de cuenta de almacenamiento y cola (opcional)

Es posible que en el futuro se agregue compatibilidad para procesar cambios en tiempo real en graph connectors Service. En ese caso, supervisaremos las notificaciones de cambio de Azure Storage almacenadas en una cola. Tendrá que crear una cola en la misma cuenta que la cuenta de Azure Storage.

Después de crear una cola, vaya a la pestaña Eventos de la página cola para configurar la suscripción de eventos. Elija todos los eventos de blob que recibirá la cola y conecte la cola a la cuenta de Azure Storage.

Pruebe la conexión

Para probar la conexión, haga clic en el botón Probar conexión.

Nota:

La conexión de prueba debe realizarse correctamente para poder pasar a la siguiente sección de configuración. La cuenta de almacenamiento habilitada para ADLS gen 2 DEBE tener un contenedor y al menos un archivo dentro de ella como mínimo para que la conexión de prueba se realice correctamente. Si el contenido no existe, se producirá un error de conexión.

Paso 4: Asignar etiquetas de propiedad

Puede asignar una propiedad de origen a cada etiqueta si elige en un menú de opciones. Aunque este paso no es obligatorio, tener algunas etiquetas de propiedad mejorará la relevancia de la búsqueda y garantizará mejores resultados de búsqueda para los usuarios finales.

Paso 5: Administrar esquema

En la pantalla Administrar esquema , puede cambiar los atributos de esquema asociados a las propiedades; las opciones son Consulta, Búsqueda, Recuperar y Refinar. También puede agregar alias opcionales y elegir la propiedad Content .

Paso 6: Administrar permisos de búsqueda

Azure Data Lake Gen 2

Puede elegir ingerir las listas de Access Control (ACL) de la cuenta de Azure Data Lake Gen 2 Storage. Cuando se establecen estos permisos de búsqueda, el contenido de búsqueda se recorta en función de los permisos del usuario que ha iniciado sesión Microsoft Entra id. Como alternativa, puede optar por hacer que todo el contenido indexado de la cuenta de almacenamiento sea visible para todos los usuarios de la organización. En este caso, todos los usuarios de la organización tendrán acceso a todos los datos de la cuenta de almacenamiento.

El conector de Azure Data Lake Storage Gen2 admite permisos de búsqueda visibles para todos los usuarios o solo personas con acceso a este origen de datos. Los datos indexados que aparecen en los resultados de la búsqueda podrían ser visibles para los usuarios de la organización que tienen acceso a cada elemento.

Azure Blob Storage

Para una conexión a Azure Blob Storage, todo el contenido indexado desde el origen configurado es visible para todos los usuarios de la organización. Las listas de control de acceso no se admiten en el nivel de blob en Azure Blob Storage.

Paso 7: Establecer la programación de actualización

En la pantalla Actualizar configuración , puede establecer el intervalo de rastreo incremental y el intervalo de rastreo completo. Los intervalos predeterminados para el conector de Azure Data Lake Storage Gen2 son 15 minutos para un rastreo incremental y una semana para un rastreo completo.

Paso 8: Revisión de la conexión

Siga las instrucciones generales de configuración.

Limitaciones

No se puede volver a configurar una conexión publicada para Azure Blob Storage para Azure Data Lake Storage Gen2 origen y al revés. En estos escenarios, se recomienda configurar una nueva conexión.

Además, el tamaño de los archivos debe ser de 4 MB o menos para que se rastreen. Los tipos de archivo admitidos actualmente son:

  • Word (docx, .docm, .dotx, .dotm)
  • PowerPoint (.pptm, .pptx, .potm, .potx, .ppam, .ppsm, .ppsx)
  • Excel (.xlsx, .xlsm)
  • Formatos heredados de Office (.doc, .dot, etc.)
  • Texto (.txt)
  • HTML
  • PDF

No se admiten archivos binarios como imágenes (.jpg, .bmp, etc.). Por ejemplo, si un archivo .docx contiene solo imágenes, se podría omitir porque no devolvió ningún contenido.