Teilen über


Herstellen einer Verbindung mit Azure Data Lake Gen1 in Microsoft Purview

In diesem Artikel wird der Prozess zum Registrieren einer Azure Data Lake Storage Gen1-Datenquelle in Microsoft Purview beschrieben, einschließlich Anweisungen zum Authentifizieren und Interagieren mit der Azure Data Lake Storage Gen1-Quelle.

Hinweis

Azure Data Lake Storage Gen2 ist jetzt allgemein verfügbar. Es wird empfohlen, sie noch heute zu verwenden. Weitere Informationen finden Sie auf der Produktseite.

Unterstützte Funktionen

Metadatenextraktion Vollständiger Scan Inkrementelle Überprüfung Bereichsbezogene Überprüfung Klassifizierung Bezeichnen Zugriffsrichtlinie Linie Datenfreigabe Liveansicht
Ja Ja Ja Ja Ja Ja Nein Begrenzte** Nein Nein

** Herkunft wird unterstützt, wenn das Dataset als Quelle/Senke in Data Factory Copy-Aktivität

Voraussetzungen

Registrieren

In diesem Abschnitt können Sie die ADLS Gen1-Datenquelle registrieren und einen geeigneten Authentifizierungsmechanismus einrichten, um eine erfolgreiche Überprüfung der Datenquelle sicherzustellen.

Schritte zum Registrieren

Es ist wichtig, die Datenquelle in Microsoft Purview zu registrieren, bevor Sie eine Überprüfung für die Datenquelle einrichten.

  1. Öffnen Sie das Microsoft Purview-Governanceportal wie folgt:

  2. Navigieren Sie zur Data Map --> Quellen.

    Screenshot: Link zum Öffnen des Microsoft Purview-Governanceportals

    Screenshot, der zum Link

  3. Erstellen Sie die Sammlungshierarchie mithilfe des Menüs Sammlungen , und weisen Sie den einzelnen Untersammlungen nach Bedarf Berechtigungen zu.

    Screenshot: Menü

  4. Navigieren Sie im Menü Quellen zur entsprechenden Sammlung, und wählen Sie das Symbol Registrieren aus, um eine neue ADLS Gen1-Datenquelle zu registrieren.

    Screenshot: Sammlung, die zum Registrieren der Datenquelle verwendet wird

  5. Wählen Sie die Azure Data Lake Storage Gen1-Datenquelle und dann Weiter aus.

    Screenshot, der die Auswahl der Datenquelle ermöglicht

  6. Geben Sie einen geeigneten Namen für die Datenquelle an, wählen Sie das relevante Azure-Abonnement, den Namen des vorhandenen Data Lake Store-Kontos und die Sammlung aus, und wählen Sie Anwenden aus.

    Screenshot: Details, die eingegeben werden müssen, um die Datenquelle zu registrieren

  7. Das ADLS Gen1-Speicherkonto wird unter der ausgewählten Sammlung angezeigt.

    Screenshot: Datenquelle, die der Sammlung zugeordnet ist, um die Überprüfung zu initiieren

Überprüfung

Voraussetzungen für die Überprüfung

Um Zugriff auf die Überprüfung der Datenquelle zu haben, muss eine Authentifizierungsmethode im ADLS Gen1-Speicherkonto konfiguriert werden. Die folgenden Optionen werden unterstützt:

Hinweis

Wenn Sie eine Firewall für das Speicherkonto aktiviert haben, müssen Sie beim Einrichten einer Überprüfung die Authentifizierungsmethode für verwaltete Identitäten verwenden.

  • Systemseitig zugewiesene verwaltete Identität (empfohlen): Sobald das Microsoft Purview-Konto erstellt wurde, wird automatisch eine vom System verwaltete Identität im Azure AD-Mandanten erstellt. Abhängig vom Ressourcentyp sind bestimmte RBAC-Rollenzuweisungen erforderlich, damit microsoft Purview SAMI die Überprüfungen durchführen kann.

  • Benutzerseitig zugewiesene verwaltete Identität (Vorschau): Ähnlich wie bei einer systemseitig verwalteten Identität ist eine benutzerseitig zugewiesene verwaltete Identität eine Anmeldeinformationsressource, die verwendet werden kann, um Microsoft Purview die Authentifizierung bei Azure Active Directory zu ermöglichen. Weitere Informationen finden Sie in unserem Leitfaden zur benutzerseitig zugewiesenen verwalteten Identität.

  • Dienstprinzipal : Bei dieser Methode können Sie einen neuen Dienstprinzipal erstellen oder einen vorhandenen Dienstprinzipal in Ihrem Azure Active Directory-Mandanten verwenden.

Authentifizierung für eine Überprüfung

Verwenden der system- oder benutzerseitig zugewiesenen verwalteten Identität für die Überprüfung

Es ist wichtig, Ihrem Microsoft Purview-Konto die Berechtigung zum Überprüfen der ADLS Gen1-Datenquelle zu erteilen. Sie können die vom System verwaltete Identität oder die benutzerseitig zugewiesene verwaltete Identität auf Abonnement-, Ressourcengruppen- oder Ressourcenebene hinzufügen, je nachdem, für welche Überprüfungsberechtigungen sie verfügen soll.

Hinweis

Sie müssen besitzer des Abonnements sein, um einer Azure-Ressource eine verwaltete Identität hinzufügen zu können.

  1. Suchen Sie in der Azure-Portal entweder das Abonnement, die Ressourcengruppe oder die Ressource (z. B. ein Azure Data Lake Storage Gen1-Speicherkonto), die Der Katalog überprüfen soll.

  2. Wählen Sie Übersicht und dann Daten-Explorer aus.

    Screenshot: Speicherkonto

  3. Wählen Sie im oberen Navigationsbereich Access aus.

    Screenshot: Daten-Explorer für das Speicherkonto

  4. Wählen Sie Auswählen aus, und fügen Sie im Menü Benutzer oder Gruppe auswählen den Microsoft Purview-Namen (die vom System verwaltete Identität) oder die benutzerseitig zugewiesene verwaltete Identität (Vorschau) hinzu, die bereits in Microsoft Purview registriert wurde.

  5. Wählen Sie Lese - und Ausführungsberechtigungen aus. Stellen Sie sicher, dass Sie dieser Ordner und alle untergeordneten Elemente sowie einen Zugriffsberechtigungseintrag und einen Standardberechtigungseintrag in den Optionen hinzufügen auswählen, wie im folgenden Screenshot gezeigt. Wählen Sie OK aus.

    Screenshot: Details zum Zuweisen von Berechtigungen für das Microsoft Purview-Konto

Tipp

Ein Zugriffsberechtigungseintrag ist ein Berechtigungseintrag für aktuelle Dateien und Ordner. Ein Standardberechtigungseintrag ist ein Berechtigungseintrag, der von neuen Dateien und Ordnern geerbt wird. Wenn Sie die Berechtigung nur für derzeit vorhandene Dateien erteilen möchten, wählen Sie einen Zugriffsberechtigungseintrag aus. Um die Berechtigung zum Überprüfen von Dateien und Ordnern zu erteilen, die in Zukunft hinzugefügt werden, schließen Sie einen Standardberechtigungseintrag ein.

Verwenden des Dienstprinzipals für die Überprüfung

Erstellen eines neuen Dienstprinzipals

Wenn Sie einen neuen Dienstprinzipal erstellen müssen, müssen Sie eine Anwendung in Ihrem Azure AD-Mandanten registrieren und Zugriff auf den Dienstprinzipal in Ihren Datenquellen gewähren. Dieser Vorgang kann von Ihrem globalen Azure AD-Administrator oder anderen Rollen wie Anwendungsadministrator ausgeführt werden.

Abrufen der Anwendungs-ID des Dienstprinzipals
  1. Kopieren Sie die Anwendungs-ID (Client-ID), die in der Übersicht über den bereits erstellten Dienstprinzipal vorhanden ist.

    Screenshot: Anwendungs-ID (Client-ID) für den Dienstprinzipal

Gewähren des Zugriffs auf Ihr ADLS Gen1-Konto für den Dienstprinzipal

Es ist wichtig, Ihrem Dienstprinzipal die Berechtigung zum Überprüfen der ADLS Gen2-Datenquelle zu erteilen. Sie können den Zugriff für den Dienstprinzipal auf Abonnement-, Ressourcengruppen- oder Ressourcenebene hinzufügen, je nachdem, welche Berechtigungen er benötigt.

Hinweis

Sie müssen besitzer des Abonnements sein, um einen Dienstprinzipal zu einer Azure-Ressource hinzufügen zu können.

  1. Gewähren Sie dem Dienstprinzipal Zugriff auf das Speicherkonto, indem Sie das Speicherkonto öffnen und Übersicht -->Data Explorer

    Screenshot: Speicherkonto

  2. Wählen Sie im oberen Navigationsbereich Access aus.

    Screenshot: Daten-Explorer für das Speicherkonto

  3. Wählen Sie in der Auswahl Benutzer oder Gruppe auswählen die Option Auswählen und Dienstprinzipal hinzufügen aus.

  4. Wählen Sie Lese - und Ausführungsberechtigungen aus. Stellen Sie sicher, dass Sie dieser Ordner und alle untergeordneten Elemente und ein Zugriffsberechtigungseintrag und einen Standardberechtigungseintrag in den Optionen Hinzufügen auswählen. Wählen Sie OK aus.

    Screenshot: Details zum Zuweisen von Berechtigungen für den Dienstprinzipal

Erstellen der Überprüfung

  1. Öffnen Sie Ihr Microsoft Purview-Konto, und wählen Sie das Microsoft Purview-Governanceportal öffnen aus.

  2. Navigieren Sie zu Data map -->Sources , um die Sammlungshierarchie anzuzeigen.

    Screenshot: Sammlungshierarchie

  3. Wählen Sie unter der zuvor registrierten ADLS Gen1-Datenquelle das Symbol "Neue Überprüfung" aus.

    Screenshot: Datenquelle mit dem Symbol

Bei Verwendung einer system- oder benutzerseitig zugewiesenen verwalteten Identität

Geben Sie einen Namen für die Überprüfung an, wählen Sie die system- oder benutzerseitig zugewiesene verwaltete Identität unter Anmeldeinformationen aus, wählen Sie die entsprechende Sammlung für die Überprüfung aus, und wählen Sie Verbindung testen aus. Wählen Sie bei erfolgreicher Verbindung Weiter aus.

Screenshot: Option

Bei Verwendung eines Dienstprinzipals

  1. Geben Sie einen Namen für die Überprüfung an, wählen Sie die entsprechende Sammlung für die Überprüfung aus, und wählen Sie unter Anmeldeinformationen die Option + Neu aus.

    Screenshot: Option

  2. Wählen Sie die entsprechende Schlüsseltresorverbindung und den Geheimnisnamen aus, die beim Erstellen des Dienstprinzipals verwendet wurden. Die Dienstprinzipal-ID ist die Anwendungs-ID (Client-ID), die wie zuvor angegeben kopiert wurde.

    Screenshot: Option

  3. Wählen Sie Verbindung testen aus. Wählen Sie bei erfolgreicher Verbindung Weiter aus.

    Screenshot, der die Testverbindung für den Dienstprinzipal zeigt

Eingrenzen und Ausführen der Überprüfung

  1. Sie können ihre Überprüfung auf bestimmte Ordner und Unterordner festlegen, indem Sie die entsprechenden Elemente in der Liste auswählen.

    Festlegen des Scanbereichs

  2. Wählen Sie dann einen Überprüfungsregelsatz aus. Sie können zwischen dem Systemstandard und vorhandenen benutzerdefinierten Regelsätzen wählen oder einen neuen Regelsatz inline erstellen.

    Regelsatz überprüfen

  3. Wenn Sie einen neuen Überprüfungsregelsatz erstellen, wählen Sie die Dateitypen aus, die in die Überprüfungsregel eingeschlossen werden sollen.

    Überprüfen von Regelsatzdateitypen

  4. Sie können die Klassifizierungsregeln auswählen, die in die Überprüfungsregel eingeschlossen werden sollen.

    Scanregelsatzklassifizierungsregeln

    Auswahl des Regelsatzes überprüfen

  5. Wählen Sie Ihren Scantrigger aus. Sie können einen Zeitplan einrichten oder die Überprüfung einmal ausführen.

    Scantrigger

    Auswahl des Scantriggers

  6. Überprüfen Sie Ihre Überprüfung, und wählen Sie Speichern und ausführen aus.

    Überprüfung überprüfen

Anzeigen der Überprüfung

  1. Navigieren Sie zur Datenquelle in der Sammlung, und wählen Sie Details anzeigen aus, um die status der Überprüfung zu überprüfen.

    Überprüfung anzeigen

  2. Die Überprüfungsdetails geben den Fortschritt der Überprüfung in der letzten Ausführung status und die Anzahl der überprüften und klassifizierten Ressourcen an.

    Scandetails anzeigen

  3. Die status letzte Ausführung wird in In Bearbeitung und dann auf Abgeschlossen aktualisiert, sobald die gesamte Überprüfung erfolgreich ausgeführt wurde.

    Überprüfung wird ausgeführt angezeigt

    Überprüfung abgeschlossen anzeigen

Verwalten der Überprüfung

Überprüfungen können verwaltet oder nach Abschluss erneut ausgeführt werden.

  1. Wählen Sie den Scannamen aus, um die Überprüfung zu verwalten.

    Verwalten der Überprüfung

  2. Sie können die Überprüfung erneut ausführen, die Überprüfung bearbeiten und die Überprüfung löschen.

    Verwalten von Scanoptionen

    Hinweis

    • Durch das Löschen Ihrer Überprüfung werden keine Katalogressourcen gelöscht, die aus vorherigen Überprüfungen erstellt wurden.
    • Das Medienobjekt wird nicht mehr mit Schemaänderungen aktualisiert, wenn sich Ihre Quelltabelle geändert hat und Sie die Quelltabelle erneut überprüfen, nachdem Sie die Beschreibung auf der Registerkarte Schema von Microsoft Purview bearbeitet haben.
  3. Sie können eine inkrementelle Überprüfung oder eine vollständige Überprüfung erneut ausführen.

    Verwalten der vollständigen oder inkrementellen Überprüfung

    Verwalten von Überprüfungsergebnissen

Nächste Schritte

Nachdem Sie Ihre Quelle registriert haben, folgen Sie den folgenden Anleitungen, um mehr über Microsoft Purview und Ihre Daten zu erfahren.