Azure Data Lake Storage Gen2 Microsoft Graph-Connector

Mit dem Azure Data Lake Storage Gen2 Microsoft Graph-Connector können Benutzer in Ihrem organization nach Dateien suchen, die in Azure Blob Storage- und Azure Data Lake Gen2-Speicherkonten gespeichert sind.

Hinweis

Lesen Sie den Artikel Einrichten Ihres Microsoft Graph-Connectors , um die allgemeinen Anweisungen zum Einrichten von Connectors zu verstehen.

Dieser Artikel richtet sich an alle Benutzer, die einen Azure Data Lake Storage Gen2 Connector konfigurieren, ausführen und überwachen. Es ergänzt den allgemeinen Einrichtungsprozess und zeigt Anweisungen, die nur für den Azure Data Lake Storage Gen2-Connector gelten. Dieser Artikel enthält auch Informationen zu Einschränkungen.

In diesem Artikel wird Azure Storage als generischer Begriff für Azure Blob Storage und Azure Data Lake Gen 2 Storage verwendet.

Schritt 1: Hinzufügen eines Connectors im Microsoft 365 Admin Center

Hinzufügen Azure Data Lake Storage Gen2 Connectors

(Weitere Informationen finden Sie in den allgemeinen Setupanweisungen .)

Schritt 2: Benennen der Verbindung

Befolgen Sie die allgemeinen Setupanweisungen.

Schritt 3: Konfigurieren der Verbindungseinstellungen

Geben Sie Den primären Speicher Verbindungszeichenfolge ein. Diese Zeichenfolge ist erforderlich, um den Zugriff auf Ihr Speicherkonto zu ermöglichen. Um Ihre Verbindungszeichenfolge zu finden, wechseln Sie zum Azure-Portal, und navigieren Sie zum Abschnitt Schlüssel Ihres relevanten Azure Storage-Kontos.

Wenn Sie den AccountKey (einen Parameter im primären Speicher Verbindungszeichenfolge) nicht angeben möchten, gewähren Sie zugriff auf den Microsoft Graph-Connectorsdienst für die folgenden Rollen:

  • Storage-Blobdatenleser
  • Mitwirkender an Storage-Warteschlangendaten
  • Speicherblobdelegator

Navigieren Sie zur Registerkarte Access Control Ihres Azure Storage-Kontos, und befolgen Sie die anweisungen dort, um Zugriff auf die folgende App zu gewähren:

  • Erstanbieter-App-ID: 56c1da01-2129-48f7-9355-af6d59d42766
  • Erstanbieter-App-Name: Graph-Connectordienst

Speicherkonto- und Warteschlangenbenachrichtigungen (optional)

Unterstützung für die Verarbeitung von Änderungen in Echtzeit im Graph-Connectors-Dienst kann in Zukunft hinzugefügt werden. In diesem Fall überwachen wir Azure Storage-Änderungsbenachrichtigungen, die in einer Warteschlange gespeichert sind. Sie müssen eine Warteschlange im selben Konto wie Ihr Azure Storage-Konto erstellen.

Nachdem Sie eine Warteschlange erstellt haben, wechseln Sie auf der Seite "Warteschlange" zur Registerkarte Ereignisse , um das Ereignisabonnement zu konfigurieren. Wählen Sie alle Blobereignisse aus, die die Warteschlange empfängt, und verbinden Sie die Warteschlange mit dem Azure Storage-Konto.

Testen der Verbindung

Testen Sie die Verbindung, indem Sie auf die Schaltfläche Verbindung testen klicken.

Hinweis

Die Testverbindung muss erfolgreich sein, bevor Sie zum nächsten Konfigurationsabschnitt wechseln können. Das ADLS Gen 2-fähige Speicherkonto MUSS mindestens einen Container und mindestens eine Datei enthalten, damit die Testverbindung erfolgreich ist. Wenn der Inhalt nicht vorhanden ist, wird ein Verbindungsfehler ausgelöst.

Schritt 4: Zuweisen von Eigenschaftenbezeichnungen

Sie können jeder Bezeichnung eine Quelleigenschaft zuweisen, indem Sie aus einem Menü mit Optionen auswählen. Dieser Schritt ist zwar nicht zwingend erforderlich, aber die Verwendung einiger Eigenschaftenbezeichnungen verbessert die Relevanz der Suche und sorgt für bessere Suchergebnisse für Endbenutzer.

Schritt 5: Verwalten des Schemas

Auf dem Bildschirm Schema verwalten können Sie die den Eigenschaften zugeordneten Schemaattribute ändern. Die Optionen sind Abfrage, Suche, Abrufen und Verfeinern. Sie können auch optionale Aliase hinzufügen und die Content-Eigenschaft auswählen.

Schritt 6: Verwalten von Suchberechtigungen

Azure Data Lake Gen 2

Sie können die Access Control Lists (ACLs) aus Ihrem Azure Data Lake Gen 2 Storage-Konto erfassen. Wenn diese Suchberechtigungen festgelegt sind, wird der Suchinhalt basierend auf den Berechtigungen des angemeldeten Benutzers Microsoft Entra ID gekürzt. Alternativ können Sie festlegen, dass alle in Ihrem Speicherkonto indizierten Inhalte für alle Benutzer in Ihrem organization sichtbar sind. In diesem Fall hat jeder in Ihrem organization Zugriff auf alle Daten in Ihrem Speicherkonto.

Der Azure Data Lake Storage Gen2-Connector unterstützt Suchberechtigungen, die für Alle sichtbar sind, oder Nur Personen mit Zugriff auf diese Datenquelle. Indizierte Daten, die in den Suchergebnissen angezeigt werden, können für Benutzer im organization sichtbar sein, die Zugriff auf jedes Element haben.

Azure Blob Storage

Für eine Verbindung mit Azure Blob Storage ist der gesamte Inhalt, der aus der konfigurierten Quelle indiziert wird, für jeden in Ihrem organization sichtbar. Zugriffssteuerungslisten werden auf Blobebene in Azure Blob Storage nicht unterstützt.

Schritt 7: Festlegen des Aktualisierungszeitplans

Auf dem Bildschirm Aktualisierungseinstellungen können Sie das inkrementelle Durchforstungsintervall und das vollständige Durchforstungsintervall festlegen. Die Standardintervalle für den Azure Data Lake Storage Gen2-Connector betragen 15 Minuten für eine inkrementelle Durchforstung und eine Woche für eine vollständige Durchforstung.

Schritt 8: Überprüfen der Verbindung

Befolgen Sie die allgemeinen Setupanweisungen.

Begrenzungen

Eine veröffentlichte Verbindung für Azure Blob Storage kann nicht für Azure Data Lake Storage Gen2 Quelle neu konfiguriert werden und umgekehrt. In solchen Szenarien wird empfohlen, eine neue Verbindung zu konfigurieren.

Außerdem muss die Größe der Dateien 4 MB oder weniger betragen, damit sie durchforstet werden können. Folgende Dateitypen werden derzeit unterstützt:

  • Word (docx, .docm, .dotx, .dotm)
  • PowerPoint (.pptm, .pptx, .potm, .potx, .ppam, .ppsm, .ppsx)
  • Excel (.xlsx, .xlsm)
  • Ältere Office-Formate (.doc, .dot usw.)
  • Text (.txt)
  • HTML
  • PDF

Binärdateien wie Bilder (.jpg, .bmp usw.) werden nicht unterstützt. Wenn beispielsweise eine .docx-Datei nur Bilder enthält, wird sie möglicherweise übersprungen, da sie keinen Inhalt zurückgibt.