Azure Data Lake Storage Gen2 connecteur Microsoft Graph

Le connecteur Microsoft Graph Azure Data Lake Storage Gen2 permet aux utilisateurs de votre organization de rechercher des fichiers stockés dans des comptes de stockage Stockage Blob Azure et Azure Data Lake Gen 2.

Remarque

Lisez l’article Configurer votre connecteur Microsoft Graph pour comprendre les instructions générales de configuration des connecteurs.

Cet article s’adresse à toute personne qui configure, exécute et surveille un connecteur Azure Data Lake Storage Gen2. Il complète le processus de configuration générale et affiche des instructions qui s’appliquent uniquement au connecteur Azure Data Lake Storage Gen2. Cet article contient également des informations sur les limitations.

Dans cet article, nous utilisons Stockage Azure comme terme générique pour Stockage Blob Azure et Stockage Azure Data Lake Gen 2.

Étape 1 : Ajouter un connecteur dans le Centre d'administration Microsoft 365

Ajouter Azure Data Lake Storage Gen2 connecteur

(Pour plus d’informations, consultez les instructions d’installation générales)

Étape 2 : Nommer la connexion

Suivez les instructions d’installation générales.

Étape 3 : Configurer les paramètres de connexion

Entrez votre chaîne de connexion de stockage principal. Cette chaîne est nécessaire pour autoriser l’accès à votre compte de stockage. Pour trouver votre chaîne de connexion, accédez à la Portail Azure et accédez à la section Clés de votre compte stockage Azure approprié.

Si vous préférez ne pas fournir accountKey (paramètre dans le chaîne de connexion de stockage principal), accordez l’accès au service de connecteurs Microsoft Graph pour les rôles suivants :

  • Lecteur de données Blob de stockage
  • Contributeur aux données de file d’attente de stockage
  • Délégueur d’objets blob de stockage

Accédez à l’onglet Access Control de votre compte stockage Azure et suivez les instructions qui s’y trouvent pour accorder l’accès à l’application suivante :

  • ID d’application interne : 56c1da01-2129-48f7-9355-af6d59d42766
  • Nom de l’application interne : Service de connecteur Graph

Notifications de compte de stockage et de file d’attente (facultatif)

La prise en charge du traitement des modifications en temps réel dans le service Connecteurs Graph peut être ajoutée à l’avenir. Dans ce cas, nous allons surveiller les notifications de modification de Stockage Azure stockées dans une file d’attente. Vous devez créer une file d’attente dans le même compte que votre compte de stockage Azure.

Après avoir créé une file d’attente, accédez à l’onglet Événements de la page de file d’attente pour configurer l’abonnement aux événements. Choisissez tous les événements Blob que la file d’attente recevra et connectez la file d’attente au compte de stockage Azure.

Tester la connexion

Testez la connexion en cliquant sur le bouton Tester la connexion

Remarque

Le test de connexion doit réussir avant de pouvoir passer à la section de configuration suivante. Le compte de stockage ADLS gen 2 doit avoir un conteneur et au moins un fichier qu’il contient pour que le test de connexion réussisse. Une erreur de connexion est générée si le contenu n’existe pas.

Étape 4 : Attribuer des étiquettes de propriété

Vous pouvez affecter une propriété source à chaque étiquette en choisissant dans un menu d’options. Bien que cette étape ne soit pas obligatoire, le fait d’avoir des étiquettes de propriétés améliore la pertinence de la recherche et garantit de meilleurs résultats de recherche pour les utilisateurs finaux.

Étape 5 : Gérer le schéma

Dans l’écran Gérer le schéma , vous pouvez modifier les attributs de schéma associés aux propriétés. Les options sont Interroger, Rechercher, Récupérer et Affiner. Vous pouvez également ajouter des alias facultatifs et choisir la propriété Content .

Étape 6 : Gérer les autorisations de recherche

Azure Data Lake Gen 2

Vous pouvez choisir d’ingérer les listes de Access Control (ACL) à partir de votre compte stockage Azure Data Lake Gen2. Lorsque ces autorisations de recherche sont définies, le contenu de recherche est réduit en fonction des autorisations de l’utilisateur connecté Microsoft Entra ID. Vous pouvez également choisir de rendre tout le contenu indexé à partir de votre compte de stockage visible par tous les membres de votre organization. Dans ce cas, tous les membres de votre organization auront accès à toutes les données de votre compte de stockage.

Le connecteur Azure Data Lake Storage Gen2 prend en charge les autorisations de recherche visibles pour tout le monde ou uniquement pour les personnes ayant accès à cette source de données. Les données indexées qui apparaissent dans les résultats de la recherche peuvent être visibles par les utilisateurs du organization qui ont accès à chaque élément.

Stockage Blob Azure

Pour une connexion à Stockage Blob Azure, tout le contenu indexé à partir de la source configurée est visible par tous les utilisateurs de votre organization. Les listes de contrôle d’accès ne sont pas prises en charge au niveau de l’objet blob dans Stockage Blob Azure.

Étape 7 : Définir la planification de l’actualisation

Dans l’écran Paramètres d’actualisation , vous pouvez définir l’intervalle d’analyse incrémentiel et l’intervalle d’analyse complet. Les intervalles par défaut pour le connecteur Azure Data Lake Storage Gen2 sont de 15 minutes pour une analyse incrémentielle et d’une semaine pour une analyse complète.

Étape 8 : Vérifier la connexion

Suivez les instructions d’installation générales.

Limitations

Une connexion publiée pour Stockage Blob Azure ne peut pas être reconfigurée pour Azure Data Lake Storage Gen2 source et inversement. Dans ces scénarios, il est recommandé de configurer une nouvelle connexion.

En outre, la taille des fichiers doit être inférieure ou égale à 4 Mo pour qu’ils soient analysés. Les types de fichiers actuellement pris en charge sont les suivants :

  • Word (docx, .docm, .dotx, .dotm)
  • PowerPoint (.pptm, .pptx, .potm, .potx, .ppam, .ppsm, .ppsx)
  • Excel (.xlsx, .xlsm)
  • Formats Office hérités (.doc, .dot, etc.)
  • Texte (.txt)
  • HTML
  • PDF

Les fichiers binaires tels que les images (.jpg, .bmp, etc.) ne sont pas pris en charge. Par exemple, si un fichier .docx contient uniquement des images, il peut être ignoré car il n’a renvoyé aucun contenu.