Häufig gestellte Fragen zu Microsoft Graph Data Connect

Mit Microsoft Graph Data Connect können Entwickler Anwendungen erstellen, die Kunden verwenden können, um verwalteten Zugriff auf ihre Microsoft Graph-Datasets im großen Maßstab bereitzustellen. Dieser Artikel enthält Tipps, mit denen Sie das Microsoft Graph Data Connect-Feature nutzen können. Eine Einführung in Microsoft Graph Data Connect finden Sie in der Übersicht.

Weitere Fragen finden Sie unter Problembehandlung, oder wenden Sie sich an das Data Connect-Team.

Ist Microsoft Graph Data Connect das richtige Werkzeug für mich?

Microsoft Graph Data Connect- und Microsoft Graph-APIs bieten Zugriff auf die gleichen zugrunde liegenden Daten, aber auf sehr unterschiedliche Weise. Microsoft Graph Data Connect wurde entwickelt, um große Mengen von Datasets in großen Mengen zu extrahieren, die auf Ihre gesamte organization skalierbar sind. Während Microsoft Graph-APIs für den Zugriff auf kleine Datenmengen von ausgewählten Benutzern und Gruppen in Ihrem organization geeignet sind.

Beispielsweise können Sie Microsoft Graph Data Connect verwenden, um eine erste Extraktion der E-Mail-Daten des letzten Jahres auszuführen, und dann Microsoft Graph-APIs verwenden, um E-Mails in Echtzeit zu analysieren. Microsoft Graph Data Connect und Microsoft Graph-APIs sind unterschiedliche Tools für unterschiedliche Aufträge. Es ist wichtig, dass Sie sich überlegen, welche Zugriffsmethode für Ihr Szenario am besten geeignet ist. Weitere Informationen finden Sie unter Wann sollte ich Microsoft Graph-API oder Microsoft Graph Data Connect verwenden?

Für welche Szenarien verwenden Unternehmen Microsoft 365-Daten?

Es gibt eine beliebige Anzahl von Anwendungsfällen, die von Microsoft 365-Daten unterstützt werden können. Im Folgenden sind einige der wichtigsten Szenarien aufgeführt, an denen Kunden interessiert sind:

  • Customer Relationship Analytics: Für führungskräfte aus dem Handel gehen Sie über herkömmliche CRM-Erkenntnisse hinaus und verstehen Kundeninteraktionen und -beziehungen basierend auf Kommunikations- und Zusammenarbeitsmustern.

  • Geschäftsprozessanalyse: Sehen Sie sich für bessere Vorgänge an, wie die Arbeit tatsächlich täglich durch die organization fließt. Ermitteln Sie die manuellen Prozesse und Workflowengpässe, die automatisiert oder optimiert werden sollten.

  • Sicherheits- und Complianceanalysen: Um vertrauliche Daten zu schützen, erfahren Sie, wie Mitarbeiter vertrauliche Informationen verwenden und teilen. Implementieren Sie Anomalieerkennung, Threat Intelligence, Überwachungsprotokollanalyse, Risikomanagement und rechtsmedizinische Forensik.

  • Personen Productivity Analytics: Exportieren Sie Ihre Viva Produktivitätsmetriken, um die Transformation voranzutreiben, damit Sie Erkenntnisse in Lösungen mit digitaler Einführung, intelligenten Besprechungen und Inhalten, hybriden Arbeitsplätzen und kulturellem Wandel umwandeln können.

Wie unterscheiden sich Viva Insights und Microsoft Graph Data Connect?  

Viva Insights und Microsoft Graph Data Connect ergänzen sich. Obwohl beide auf Microsoft 365 basieren, erfüllen Viva Insights und Data Connect unterschiedliche Zielgruppen und Anforderungen.

Wenn Kunden nach Erkenntnissen und Analysen suchen, die über Viva Insights hinausgehen, bietet Data Connect die Erweiterbarkeit, um benutzerdefinierte Anforderungen zu erfüllen. Beispielsweise werden Teams-Anrufdatensätze und -Transkripte sowie SharePoint Online-Datasets angeboten, die derzeit nicht für Viva Insights gelten. Darüber hinaus bieten Data Connect-Rohdaten präzise Details, die sonst nicht in Viva Insights verfügbar sind.

Gibt es anfänglichen Mehraufwand für Microsoft Graph Data Connect?

Da Data Connect dazu entworfen wurde, große Datenmengen in einem Massenvorgang zu extrahieren, wird es anfänglich etwas Aufwand geben, bevor die Daten extrahiert werden können. Dieser Mehraufwand beträgt ca. 45 Minuten, was bedeutet, dass alle Pipelines unabhängig von der Datengröße mindestens so lange dauern. Wenn der anfängliche Mehraufwand für Ihren Anwendungsfall zu lang ist, wenden Sie sich an das Microsoft Graph Data Connect-Team.

Hinweis

Ihr Mandantenadministrator muss innerhalb von 24 Stunden nach dem Starten der Pipeline genehmigen und zustimmen. Wenn die Zustimmung nicht innerhalb von 24 Stunden erteilt wird, läuft sie ab, und Sie müssen den Zustimmungsprozess neu starten, indem Sie Ihre Pipelines erneut starten. Die Mehraufwandszeit umfasst keine Zeit, die für die Genehmigung der Zustimmung erforderlich ist.

In welchen Regionen ist Microsoft Graph Data Connect verfügbar?

Microsoft Graph Data Connect ist derzeit in mehreren Regionen in den folgenden Geografischen Regionen verfügbar: Nordamerika, Europa, Asien-Pazifik, Vereinigtes Königreich/Großbritannien und Australien. Weitere Regionen werden in Zukunft verfügbar sein.

Eine Liste der Regionen und Zuordnungen von Office zu Azure finden Sie unter Datasets, Regionen und Senken.

Welche Datasets sind über Microsoft Graph Data Connect verfügbar?

Die folgenden Datasettypen sind verfügbar:

  • Basic: Datasets, die aus vom Kunden erstellten Rohinhalten und Eingaben von Microsoft 365-Anwendungen und -Diensten generiert wurden (z. B. Microsoft Entra ID-, Outlook- oder Teams-Datasets). 

  • Bereinigt: Datasets, die entweder durch Normalisierung und Deduplizierung aus grundlegenden Datasets generiert werden, oder Datasets, die aus Benutzeraktivitäts- oder Verhaltenssignalen in Microsoft 365 erstellt wurden (z. B. SharePoint, Office 365 Datasets).  

  • Kuratiert: Datasets, die für einen bestimmten Anwendungsfall oder Analyseszenarien generiert wurden, oder Datasets aus Microsoft 365-Analyseanwendungen von Erstanbietern für ihre Erweiterbarkeit, z. B. Viva Insights Metriken).

Für jedes der folgenden Datasets sind mehrere Datasets verfügbar:

  • Teams
  • Outlook
  • Microsoft Entra-ID
  • OneDrive/SharePoint
  • Viva Insights

Microsoft Graph Data Connect werden regelmäßig neue Datasets hinzugefügt. Eine vollständige Liste finden Sie unter Dataset, Regionen und Senken.

Welche Datasets befinden sich in der Vorschauphase und welche sind allgemein verfügbar?

Datasets für OneDrive/SharePoint und Viva Insights sind derzeit für Kunden in der Vorschauversion oder für Benutzer verfügbar, die über die Viva Insights Lizenz verfügen.

Informationen zu Datasets, die allgemein verfügbar sind oder sich nur in der Vorschau befinden, finden Sie unter Dataset, Regionen und Senken.

Wie wird die Abrechnung berechnet?

Microsoft Graph Data Connect berechnet Kunden monatlich und führt bei der Berechnung der Rechnung auch bruchweise Rundungen durch. Jede Pipelineausführung wird separat abgerechnet.

Beispielsweise verfügt ein Kunde innerhalb des Monats über 20 Pipelineausführungen, die jeweils 500 Zeilen ergeben. Insgesamt führt der Kunde in diesem Monat Pipelines für 10.000 Zeilen aus. Ihre Rechnung ist jedoch nicht 10.000 Zeilen/1000 Zeilen = 10 Einheiten.

Stattdessen werden dem Kunden 20 Einheiten in Rechnung gestellt, da Microsoft Graph Data Connect Brüche aufrundet. Da 500 Zeilen /1000 Zeilen = 0,5 und 0,5 ein Bruchteil ist, wird sie auf 1 aufgerundet. Dem Kunden wird eine Einheit pro Pipelineausführung in Rechnung gestellt, sodass insgesamt 20 Einheiten abgerechnet werden.

Was kann ich tun, wenn ein Dataset für meinen Mandanten noch nicht unterstützt wird?

Stellen Sie für Datasets wie OneDrive/SharePoint und Viva Insights sicher, dass Sie die unter Datasets, Regionen und Senken beschriebenen Kriterien erfüllen. Diese Datasets sind nur für Kunden verfügbar, die sich explizit für sie entschieden haben.

Wenden Sie sich bei Fragen an das Microsoft Graph Data Connect-Team.

Für welche Szenarien eignet sich Microsoft Graph Data Connect am besten?

Organisationen, die die großen Datasets nutzen können, die ihre Produktivitätstools unterstützen, können enorme Einblicke in die Herausforderungen und Chancen erhalten, die ihnen möglicherweise begegnen. Kunden erstellen Anwendungen über mehrere Szenarien hinweg, z. B. organization Netzwerke für Die Produktivität von Personen nalytics, Informationsüberteilung für Sicherheits- und Complianceanalysen, Verkäuferbeziehungsstärken für Kundenbeziehungsanalysen und vieles mehr.

Können meine Daten mit Microsoft Graph Data Connect innerhalb des Abonnements der Organisation bleiben?

Microsoft Graph Data Connect respektiert die Mandantengrenze Ihrer Organisation bei der Bereitstellung der angeforderten Datasets. Sowohl Azure-Ressourcen als auch Microsoft 365-Dienste müssen sich innerhalb desselben Microsoft Entra Mandanten befinden, um auf Ihr Microsoft 365-Dataset zugreifen zu können. Mandantenübergreifender Datasetzugriff ist derzeit nicht verfügbar.

Sind mit Microsoft Graph Data Connect Dienstprinzipale erforderlich?

Beim Erstellen der Azure Synapse- oder Data Factory-Pipeline müssen Sie einen Dienstprinzipal für den verknüpften Microsoft 365-Dienst bereitstellen. Ein Dienstprinzipal ist in Azure eine Sicherheitsidentität, die eine Anwendung bzw. einen Dienst (im Gegensatz zu einem Benutzer) verkörpert. Microsoft Graph Data Connect verwendet diesen Dienstprinzipal als Identität, wenn sie autorisierten Zugriff auf Ihre Microsoft 365-Daten erhält.

Wenn Sie eine von Azure verwaltete Anwendung für andere Personen zur Verwendung in ihren Mandanten erstellen, müssen Sie dennoch einen Dienstprinzipal für die App festlegen. Dieser Dienstprinzipal ist in Ihrem Mandanten (dem des Herausgebers) vorhanden. Wenn die App jedoch andere Dienstprinzipale benötigt, erstellt Ihr Kunde (das Installationsprogramm) sie in einem eigenen Mandanten. Beispielsweise benötigt Ihre Azure Synapse- oder Azure Data Factory-Pipeline wahrscheinlich Zugriff auf eine Speicherressource in Azure. Der Kunde würde den Dienstprinzipal mit Berechtigungen für das Speicherkonto ausstatten, welche die Pipeline verwenden kann.

Weitere Informationen zum Erstellen Ihrer Anwendung mit Azure Synapse oder Azure Data Factory finden Sie im Schnellstart zu Data Connect.

Wie kann ich überprüfen, ob PAM-Anforderungen (Privileged Access Management) ausstehen?

Bevor Microsoft Graph Data Connect Ihre Daten kopieren kann, muss ein Administrator eine Privileged Access Management (PAM)-Anforderung genehmigen. PAM ist der Mechanismus, der verwendet wird, um den Zugriff Ihrer Datenpipeline auf die Daten in Microsoft 365 zu autorisieren.

Wenn Sie zum ersten Mal eine Pipeline auslösen, wartet diese auf einen Microsoft 365-Administrator (oder einen ernannten Delegierten), der die Zugriffsanforderung genehmigt. Obwohl der Status der Pipeline In Bearbeitung anzeigt, besitzt der zugrunde liegende Kopiervorgang den Status ConsentPending, bis die Genehmigung erteilt wird, wie im folgenden Screenshot gezeigt.

Screenshot des Pipeline-Statusbereichs mit dem Status ConsentPending

Während der Entwicklung ist es ratsam, sicherzustellen, dass Ihre Pipelineausführungen nicht im Status ConsentPending hängen bleiben, insbesondere dann, wenn Sie eine Änderung an der Pipeline vorgenommen haben. Wenn Sie dem Schema beispielsweise ein zusätzliches Feld hinzufügen, löst die nächste Pipelineausführung eine neue PAM-Anforderung aus, die genehmigt werden muss. Vergeuden Sie keine Zeit, indem Sie auf eine Pipeline warten, die auf Ihre Genehmigung wartet.

Beachten Sie, dass Zustimmungsanforderungen nach 24 Stunden ablaufen, wenn sie nicht genehmigt werden, und die Pipeline schlägt fehl. Darüber hinaus ist die PAM-Genehmigung nur für 6 Monate gültig (sofern nicht widerrufen).

Wie kann ich PAM-Anforderungen über die Microsoft 365 Admin Center genehmigen?

Um die Verwendung von PAM UX zu genehmigen, besuchen Sie die PAM-Schnittstelle im Microsoft 365 Admin Center. Das Admin Center bietet eine einfache und benutzerfreundliche Möglichkeit zum Anzeigen und Genehmigen/Ablehnen/Sperren von PAM Anforderungen.

So genehmigen Sie eine Anforderung:

  • Wenn Sie Microsoft Graph Data Connect aktivieren, müssen Sie sich in der Gruppe der genehmigenden Person befinden.
  • Benutzer müssen über die Rolle "Global Admin" verfügen.
  • Benutzern muss eine Exchange Online Lizenz zugewiesen sein.

Führen Sie die folgenden Schritte aus, um eine PAM-Anforderung zu genehmigen oder zu verweigern:

  1. Melden Sie sich unter Microsoft 365 Admin Center an der PAM-Schnittstelle an.
  2. Klicken Sie im rechten Bereich auf Einstellungen>Organisationseinstellungen>Dienste>Microsoft Graph Data Connect.
  3. Suchen Sie die Anforderung.
  4. Überprüfen Sie die Anforderungsdetails.
  5. Fügen Sie bei Bedarf die Bereinigung der Ablehnungsliste hinzu.
  6. Genehmigen oder ablehnen Sie die Anforderung.

Weitere Informationen finden Sie im Schnellstart zu Data Connect.

Solange der Umfang der extrahierten Daten für Datasets, Spalten, Benutzer usw. gleich bleibt, löst die Pipelineausführung KEINE neue Zustimmungsanforderung aus. Stattdessen verwendet die Pipeline die genehmigte Zustimmung, die 6 Monate lang gültig ist. Das Ausführen einer Pipeline mit demselben Bereich für unterschiedliche Datumsangaben löst auch KEINE neue Zustimmung aus.

Eine neue Zustimmungsanforderung wird ausgelöst, wenn sich der Datenbereich ändert, z. B. das Hinzufügen eines neuen Datasets, das Auswählen weiterer Spalten oder das Hinzufügen anderer Benutzer. Eine neue Zustimmung kann auch ausgelöst werden, wenn der Pipeline- oder Aktivitätsname in Azure Synapse oder Azure Data Factory geändert wird.

Warum benötige ich einen zweiten Benutzer, um PAM-Anforderungen zu genehmigen?

Wenn Sie eine Ausführung einer Datasetpipeline anfordern, überprüft der Microsoft Graph Data Connect-Dienst und löst dann bei Bedarf eine PAM-Genehmigungsanforderung aus. Die Anforderung wird an die genehmigende Person gesendet, die für den Mandanten definiert ist, wenn Sie Microsoft Graph Data Connect im Microsoft Admin Center aktivieren.

Auch wenn dieses Konto Teil der gruppe genehmigenden Personen ist, die Sie eingerichtet haben, können Sie es nicht verwenden, um die PAM-Anforderung zu genehmigen, da Selbstgenehmigungen nicht zulässig sind. Sollten Sie es dennoch versuchen, erhalten Sie eine Fehlermeldung im PAM-Portal: „Antragsteller und genehmigende Person sind identisch. Selbstgenehmigungen sind nicht zulässig.“

Während der Entwicklung sollten Sie ein zweites Benutzerkonto besitzen, zusätzlich zu dem Administrator, das die Anforderungen genehmigt. Sowohl der Absender als auch die genehmigende Person muss ein aktives Exchange Online-Konto besitzen.

Kann ich bei Bedarf Duplikate von E-Mails entfernen?

Wenn Sie E-Mails aus dem Message-Dataset extrahieren, gibt es häufig mehrere JSON-Objekte für dieselbe E-Mail. Diese Duplikate existieren, da beim Versenden einer E-Mail an mehrere Empfänger eine Kopie dieser E-Mail in dem Postfach jedes Empfängers vorhanden ist. Da das Dataset aus jedem Postfach extrahiert wird, enthält es alle Kopien zwischen Benutzern. In einigen Szenarien kann es möglicherweise notwendig sein, jede Kopie aufzubewahren. In anderen Fällen möchten Sie die Duplikate möglicherweise entfernen.

Sie können die exportierten JSON-Objekte basierend auf der internetMessageId der Nachrichten deduplizieren: Zwei Nachrichten mit demselben internetMessageId sind Duplikate derselben Instanz. Da die Duplikate in verschiedenen Blobs existieren können, müssen Sie über alle Blobs hinweg deduplizieren statt separat in jedem einzelnen Blob.

Kann ich das Puser-Feld verwenden, um den relevanten Benutzer zu bestimmen?

Die extrahierten Daten enthalten einige Meta-Eigenschaften, die bei Verwendung der entsprechenden Microsoft Graph APIs nicht vorhanden sind. Insbesondere kann das puser-Feld dazu genutzt werden, um festzustellen, von welchem Benutzer die Daten extrahiert wurden. In dem Szenario, in dem Sie zwei Kopien derselben E-Mail in unterschiedlichen Postfächern haben, können Sie das puser-Feld benutzen, um zu bestimmen, welche Kopie aus welchem Postfach stammt. Das puser-Feld ist auch für DataSets wie das Manager-Dataset hilfreich. Der exportierte JSON-Code enthält Informationen zu einem Vorgesetzten, aber dies ist nur nützlich, wenn Sie wissen, um wen es sich handelt. Das puser-Feld verrät Ihnen, auf wessen Manager sich dieses JSON-Objekt bezieht.

Wird die hybride Mandanteneinrichtung unterstützt?

Wenn in Ihrem Microsoft 365-Setup einige Benutzer in Exchange Online und einige lokale Exchange-Benutzer vorhanden sind, werden Letztere nicht unterstützt. Leider wird Data Connect derzeit nicht für lokale Exchange-Benutzer unterstützt.

Werden Ressourcenkonten unterstützt?

Der Zugriff auf Nachrichten oder Ereignisse von Ressourcenkonten aus wird derzeit nicht unterstützt.

Warum sehe ich manchmal mehrere Dateien pro Ausführung der ADF-Pipeline, während in anderen Fällen nur eine Datei pro Ausführung angezeigt wird?

Microsoft Graph Data Connect bezieht sich auf die Benutzerliste für jede Pipelineausführung und verteilt die Datasetextraktion und -organisation dann auf mehrere parallel ausgeführte Aufträge. Für jede parallele Ausführung wird in einer der von Ihnen definierten Datensenke eine Ausgabedatei generiert. Wenn die Benutzerliste klein ist, werden sie in einigen Fällen möglicherweise einem Extraktions- und Zusammenstellungsauftrag zugeordnet, und in diesen Fällen wird nur eine Ausgabedatei in der Datensenke generiert.