Forum aux questions sur la Connexion aux données Microsoft Graph

La Connexion aux données Microsoft Graph permet aux développeurs de créer des applications que les clients peuvent utiliser pour fournir un accès géré à leurs jeux de données Microsoft Graph à grande échelle. Cet article contient des conseils qui vous aideront à tirer parti de la fonctionnalité Connexion aux données. Pour une présentation de la Connexion aux données Microsoft Graph, consultez la vue d’ensemble.

La Connexion aux données Microsoft Graph est-elle pour moi ?

Connexion aux données et les API Microsoft Graph permettent d’accéder aux mêmes données sous-jacentes, mais de manière très différente. Connexion aux données est conçue pour extraire de grandes quantités de données en bloc, tandis que les API Microsoft Graph sont plus adaptées pour accéder à des jeux de données discrets en temps réel. Dans certains cas, il peut même être judicieux de les combiner. Par exemple, vous pouvez utiliser Connexion aux données pour effectuer une extraction initiale de la dernière année de données de messagerie, puis utiliser les API Microsoft Graph pour analyser les e-mails en temps réel. Connexion aux données et les API Microsoft Graph sont des outils différents qui s’appliquent à des tâches différentes. Veillez à utiliser la méthode d’accès la mieux adaptée à votre scénario. Pour plus d’informations, consultez Quand dois-je utiliser Microsoft API Graph ou la Connexion aux de données.

Y a-t-il une surcharge initiale ?

Étant donné que la Connexion aux données est conçue pour extraire de grandes quantités de données en bloc, un traitement initial s’impose avant l’extraction des données. Cette surcharge est d’environ 45 minutes, ce qui signifie que tous les pipelines prennent au moins autant de temps, quelle que soit la taille des données. Le coût peut être négligeable pour les grandes quantités de données, mais si le délai de traitement est inacceptable dans votre scénario, les API Microsoft Graph peuvent constituer une meilleure approche.

Combien dois-je payer pour la Connexion aux données ?

Les frais de consommation de Connexion aux données Microsoft Graph sont facturés mensuellement sur la base d’un paiement à l’utilisation. L’unité de facturation de la Connexion aux données se fait avec un multiple de 1000 objets, où 1 objet est mappé à 1 instance individuelle d’une entité dans Microsoft 365. Par exemple, 1 e-mail == 1 objet, 1 fichier == 1 objet, 1 message de conversation Teams == 1 objet, etc. Les frais sont calculés à l’aide d’un taux forfaitaire basé sur le nombre d’objets par 1000 extraits via le connecteur. Il n’existe aucun frais pour l’extraction d’objets à partir des jeux de données suivants :

  • BasicDataSet_v0.User
  • BasicDataSet_v0.MailboxSettings
  • BasicDataSet_v0.Manager
  • BasicDataSet_v0.DirectReport

Dans quelles régions la Connexion aux données est-elle disponible ?

La Connexion aux données Microsoft Graph est actuellement disponible dans les régions suivantes : Amérique du Nord, Europe, Asie-Pacifique et Australie. D’autres régions suivront prochainement.

Quels jeux de données sont disponibles via la Connexion aux données ?

La Connexion aux données Microsoft Graph inclut actuellement les jeux de données suivants :

  • Teams : 1:1, 1:N et messages de conversation de réunion
  • Outlook : messages, événements, contacts, éléments envoyés, entité utilisateur, paramètres de la boîte aux lettres, affichage du calendrier, rapports du gestionnaire et des directeurs, et dossiers de courrier.

Nous prévoyons d'ajouter de nouveaux ensembles de données à l'avenir et nous divulguerons les échéances le cas échéant. Toutefois, il est peu probable que nous exposerions chaque jeu de données Microsoft Graph par le biais de la Connexion aux données Microsoft Graph.

Quels scénarios la Connexion aux données traite-t-elle le mieux ?

Les organisations qui peuvent exploiter les jeux de données volumineux qui alimentent leurs outils de productivité peuvent obtenir des informations considérables sur les défis et les opportunités qu’elles peuvent rencontrer. Lors de notre préversion publique, nous avons vu des clients intéressés par la productivité des ventes, l’archivage et la gestion des données, l’optimisation de l’organisation, les flux de travail intelligents et la garantie de la conformité.

Mes données peuvent-elles rester dans l’abonnement de l’organisation avec la Connexion aux données Microsoft Graph ?

Les pipelines de la Connexion aux données Microsoft Graph sont orchestrées par Azure Data Factory, un service d’intégration de données qui s’exécute dans un abonnement Azure. L’abonnement Azure est associé à un seul locataire Microsoft 365. Ainsi, les données doivent d’abord être acheminées vers un abonnement Azure associé. Au terme d’une minimisation et d’une agrégation plus poussées, les données peuvent être utilisées ailleurs.

Si vous souhaitez créer une application que d’autres pourront utiliser pour extraire leurs données Microsoft 365, vous pouvez la packager en tant qu’Application managée Azure et la publier sur la Place de marché Azure. Un utilisateur pourra alors déployer votre application dans le cadre de son propre abonnement Azure, et celle-ci aura accès aux données dans le locataire de cette personne.

Les principaux du service sont-ils requis avec la Connexion aux données Microsoft Graph ?

Lors de la création du pipeline Data Factory, vous devez fournir un principal de service au service lié Microsoft 365. Dans Azure, un principal de service est une identité de sécurité qui représente une application ou un service (par opposition à un utilisateur). La Connection aux données Microsoft Graph utilise ce principal de service comme identité lors de l’obtention d’un accès autorisé à vos données Microsoft 365.

Si vous créez une application managée Azure que d’autres utilisateurs peuvent utiliser dans leurs clients, vous fournissez toujours un principal de service pour l’application à utiliser. Ce principal de service existe dans votre client (le serveur de publication). Toutefois, si l’application a besoin d’autres principaux de service, votre client (le programme d’installation) les crée dans son propre client. Par exemple, votre pipeline Data Factory a probablement besoin d’accéder à une ressource de stockage dans Azure. Le client crée le principal de service avec des autorisations sur le compte de stockage que le pipeline doit utiliser.

Comment puis-je vérifier les demandes PAM en attente ?

Avant que la Connexion aux données Microsoft Graph puisse copier vos données, un administrateur doit approuver une demande Privileged Access Management (PAM). PAM est le mécanisme utilisé pour autoriser votre pipeline de données à accéder aux données de Microsoft 365. La première fois que vous déclenchez un pipeline, il attend qu’un administrateur Microsoft 365 (ou un délégué désigné) approuve la demande d’accès. Bien que l’état du pipeline indique In progress (En cours), l’activité de copie sous-jacente passe à l’état ConsentPending (En attente de consentement) jusqu’à ce que l’approbation soit accordée, comme illustré sur la capture d’écran suivante.

Capture d’écran du volet d’état d’exécution du pipeline, avec l’état ConsentPending (En attente de consentement)

Pendant le développement, il est judicieux de s’assurer que les exécutions de votre pipeline ne sont pas bloquées sur consentPending, en particulier après avoir apporté une modification à votre pipeline. Par exemple, si vous ajoutez un champ supplémentaire au schéma, la prochaine exécution du pipeline émet une nouvelle demande PAM qui doit être approuvée. Ne perdez pas de temps à attendre un pipeline en attente de votre approbation.

Comment puis-je approuver les demandes PAM via le Centre d’administration Microsoft 365 ?

La documentation relative à la Connexion aux données explique comment utiliser PowerShell et l’expérience utilisateur PAM pour approuver les demandes PAM. Pour les approuver à l’aide de l’expérience utilisateur PAM, visitez l’interface PAM sur le Portail d’administration de Microsoft 365. Le Centre d’administration offre un moyen simple et convivial d’afficher et d’approuver/refuser/révoquer des demandes PAM. Vous trouverez un lien vers celui-ci dans le complément Connexion aux données Microsoft Graph sous Paramètres > Services et compléments > Connexion aux données Microsoft Graph.

Puis-je avoir un deuxième utilisateur pour approuver les demandes PAM ?

Lorsque vous exécutez un pipeline et déclenchez une demande PAM, celle-ci est associée au compte d’utilisateur propriétaire du principal de service utilisé par le pipeline. Mais même si ce compte fait partie du groupe d’approbateurs que vous avez configuré, vous ne pouvez pas l’utiliser pour approuver la demande PAM car les auto-approbations ne sont pas autorisées. Si vous essayez, le message d’erreur suivant apparaîtra sur le portail PAM : « Le demandeur et l’approbateur sont les mêmes. L’auto-approbation n’est pas autorisée. » Pour le développement, vous pourrez créer un deuxième compte en plus de celui de l’administrateur qui approuve les demandes. L’émetteur de la demande et l’approbateur doivent tous deux disposer de comptes Exchange Online actifs.

Puis-je dédupliquer les e-mails en cas de besoin ?

Lorsque vous extrayez des e-mails du jeu de données Message, il existe souvent plusieurs objets JSON pour le même e-mail. Ces doublons existent car, lorsqu’un e-mail est envoyé à plusieurs personnes, une copie de celui-ci est adressée à la boîte aux lettres de chaque destinataire. Étant donné que le jeu de données est extrait de chaque boîte aux lettres, il contient toutes les copies entre les utilisateurs. Dans certains scénarios, il peut être nécessaire de conserver chaque copie, mais dans d’autres, vous souhaiterez peut-être supprimer les doublons.

Vous pouvez dédupliquer les objets JSON exportés en fonction de la internetMessageId des messages : deux messages avec le même internetMessageId sont des copies dupliquées de la même instance. Comme les doublons peuvent se trouver dans différents objets blob, vous devez procéder à la déduplication sur tous les objets blob et non séparément sur chaque objet blob.

Puis-je utiliser le champ puser pour déterminer l’utilisateur approprié ?

Les données extraites incluent des métapropriétés qui n’existent pas lorsque les API Microsoft Graph correspondantes sont utilisées. Plus précisément, le champ puser peut être utile pour déterminer à partir de quel utilisateur les données ont été extraites. Si vous disposez de deux copies du même e-mail dans des boîtes aux lettres différentes, vous pouvez utiliser le champ puser pour déterminer quelle copie provient de quelle boîte aux lettres. Le champ puser est également utile pour les jeux de données tels que le jeu de données Manager. Le fichier JSON exporté contient des informations sur un responsable, mais cela n’est utile que si vous savez de qui il s’agit. Le champ puser vous indique à quel gestionnaire correspond cet objet JSON.

La configuration de client en mode hybride est-elle prise en charge ?

Si votre configuration Microsoft 365 comporte des utilisateurs dans Exchange Online et d’autres dans Exchange en local, les utilisateurs qui se trouvent dans Exchange en local ne sont pas pris en charge. Malheureusement, nous ne prenons actuellement pas en charge la Connexion des données pour les utilisateurs Exchange locaux.

Les comptes de ressource sont-ils pris en charge ?

Nous ne prenons actuellement pas en charge l’accès aux messages ou événements à partir des comptes de ressource.

Pourquoi est-ce que je vois parfois plusieurs fichiers par exécution de pipeline ADF, mais d’autres fois un seul fichier par exécution ?

La Connexion aux données Microsoft Graph prend la liste des utilisateurs pour chaque exécution de pipeline, puis distribue l’extraction et la curation du jeu de données sur plusieurs travaux qui s’exécutent en parallèle. Pour chaque exécution parallèle, un fichier de sortie est généré dans le récepteur de données défini par vous. Dans certains cas, si la liste d’utilisateurs est petite, elles peuvent être mappées dans un travail d’extraction et de curation, et dans ce cas, un seul fichier de sortie est généré dans le récepteur de données.

Comment la facturation est-elle calculée lorsque le nombre d’objets n’est pas un nombre arrondi ?

À des fins de facturation, la Connexion aux données Microsoft Graph arrondit au millier d’objets extraits le plus proche. Par exemple, si vous extrayez 125 objets ou 999 objets, vous êtes facturé pour 1000 objets. De la même manière, si vous extrayez entre 1001 et 2000 objets, vous recevrez une facture pour 2000 objets.

Pourquoi mon activité de copie de données Microsoft 365 échoue-t-elle toujours lors de l’initialisation via Azure Synapse ?

Nous ne prenons actuellement pas en charge l'initialisation de l'activité de copie de données de Microsoft 365 via Azure Synapse. Nous mettons tout en œuvre pour ajouter l’intégration de l’activité initialisée via Azure Synapse et nous mettrons à jour notre documentation dès sa finalisation.