Herstellen einer Verbindung mit Azure Data Lake Gen1 in Microsoft Purview
In diesem Artikel wird der Prozess zum Registrieren einer Azure Data Lake Storage Gen1-Datenquelle in Microsoft Purview beschrieben, einschließlich Anweisungen zum Authentifizieren und Interagieren mit der Azure Data Lake Storage Gen1-Quelle.
Hinweis
Azure Data Lake Storage Gen2 ist jetzt allgemein verfügbar. Es wird empfohlen, sie noch heute zu verwenden. Weitere Informationen finden Sie auf der Produktseite.
Unterstützte Funktionen
Metadatenextraktion | Vollständiger Scan | Inkrementelle Überprüfung | Bereichsbezogene Überprüfung | Klassifizierung | Bezeichnen | Zugriffsrichtlinie | Linie | Datenfreigabe | Liveansicht |
---|---|---|---|---|---|---|---|---|---|
Ja | Ja | Ja | Ja | Ja | Ja | Nein | Begrenzte** | Nein | Nein |
** Herkunft wird unterstützt, wenn das Dataset als Quelle/Senke in Data Factory Copy-Aktivität
Voraussetzungen
Ein Azure-Konto mit einem aktiven Abonnement. Erstellen Sie kostenlos ein Konto.
Ein aktives Microsoft Purview-Konto.
Sie müssen Datenquellenadministrator und Datenleser sein, um eine Quelle zu registrieren und im Microsoft Purview-Governanceportal zu verwalten. Weitere Informationen finden Sie auf der Seite Microsoft Purview-Berechtigungen .
Registrieren
In diesem Abschnitt können Sie die ADLS Gen1-Datenquelle registrieren und einen geeigneten Authentifizierungsmechanismus einrichten, um eine erfolgreiche Überprüfung der Datenquelle sicherzustellen.
Schritte zum Registrieren
Es ist wichtig, die Datenquelle in Microsoft Purview zu registrieren, bevor Sie eine Überprüfung für die Datenquelle einrichten.
Öffnen Sie das Microsoft Purview-Governanceportal wie folgt:
- Navigieren Sie direkt zu https://web.purview.azure.com Ihrem Microsoft Purview-Konto, und wählen Sie es aus.
- Öffnen Sie die Azure-Portal, suchen Sie nach dem Microsoft Purview-Konto, und wählen Sie es aus. Wählen Sie die Schaltfläche Microsoft Purview-Governanceportal aus.
Navigieren Sie zur Data Map --> Quellen.
Erstellen Sie die Sammlungshierarchie mithilfe des Menüs Sammlungen , und weisen Sie den einzelnen Untersammlungen nach Bedarf Berechtigungen zu.
Navigieren Sie im Menü Quellen zur entsprechenden Sammlung, und wählen Sie das Symbol Registrieren aus, um eine neue ADLS Gen1-Datenquelle zu registrieren.
Wählen Sie die Azure Data Lake Storage Gen1-Datenquelle und dann Weiter aus.
Geben Sie einen geeigneten Namen für die Datenquelle an, wählen Sie das relevante Azure-Abonnement, den Namen des vorhandenen Data Lake Store-Kontos und die Sammlung aus, und wählen Sie Anwenden aus.
Das ADLS Gen1-Speicherkonto wird unter der ausgewählten Sammlung angezeigt.
Überprüfung
Voraussetzungen für die Überprüfung
Um Zugriff auf die Überprüfung der Datenquelle zu haben, muss eine Authentifizierungsmethode im ADLS Gen1-Speicherkonto konfiguriert werden. Die folgenden Optionen werden unterstützt:
Hinweis
Wenn Sie eine Firewall für das Speicherkonto aktiviert haben, müssen Sie beim Einrichten einer Überprüfung die Authentifizierungsmethode für verwaltete Identitäten verwenden.
Systemseitig zugewiesene verwaltete Identität (empfohlen): Sobald das Microsoft Purview-Konto erstellt wurde, wird automatisch eine vom System verwaltete Identität im Azure AD-Mandanten erstellt. Abhängig vom Ressourcentyp sind bestimmte RBAC-Rollenzuweisungen erforderlich, damit microsoft Purview SAMI die Überprüfungen durchführen kann.
Benutzerseitig zugewiesene verwaltete Identität (Vorschau): Ähnlich wie bei einer systemseitig verwalteten Identität ist eine benutzerseitig zugewiesene verwaltete Identität eine Anmeldeinformationsressource, die verwendet werden kann, um Microsoft Purview die Authentifizierung bei Azure Active Directory zu ermöglichen. Weitere Informationen finden Sie in unserem Leitfaden zur benutzerseitig zugewiesenen verwalteten Identität.
Dienstprinzipal : Bei dieser Methode können Sie einen neuen Dienstprinzipal erstellen oder einen vorhandenen Dienstprinzipal in Ihrem Azure Active Directory-Mandanten verwenden.
Authentifizierung für eine Überprüfung
Verwenden der system- oder benutzerseitig zugewiesenen verwalteten Identität für die Überprüfung
Es ist wichtig, Ihrem Microsoft Purview-Konto die Berechtigung zum Überprüfen der ADLS Gen1-Datenquelle zu erteilen. Sie können die vom System verwaltete Identität oder die benutzerseitig zugewiesene verwaltete Identität auf Abonnement-, Ressourcengruppen- oder Ressourcenebene hinzufügen, je nachdem, für welche Überprüfungsberechtigungen sie verfügen soll.
Hinweis
Sie müssen besitzer des Abonnements sein, um einer Azure-Ressource eine verwaltete Identität hinzufügen zu können.
Suchen Sie in der Azure-Portal entweder das Abonnement, die Ressourcengruppe oder die Ressource (z. B. ein Azure Data Lake Storage Gen1-Speicherkonto), die Der Katalog überprüfen soll.
Wählen Sie Übersicht und dann Daten-Explorer aus.
Wählen Sie im oberen Navigationsbereich Access aus.
Wählen Sie Auswählen aus, und fügen Sie im Menü Benutzer oder Gruppe auswählen den Microsoft Purview-Namen (die vom System verwaltete Identität) oder die benutzerseitig zugewiesene verwaltete Identität (Vorschau) hinzu, die bereits in Microsoft Purview registriert wurde.
Wählen Sie Lese - und Ausführungsberechtigungen aus. Stellen Sie sicher, dass Sie dieser Ordner und alle untergeordneten Elemente sowie einen Zugriffsberechtigungseintrag und einen Standardberechtigungseintrag in den Optionen hinzufügen auswählen, wie im folgenden Screenshot gezeigt. Wählen Sie OK aus.
Tipp
Ein Zugriffsberechtigungseintrag ist ein Berechtigungseintrag für aktuelle Dateien und Ordner. Ein Standardberechtigungseintrag ist ein Berechtigungseintrag, der von neuen Dateien und Ordnern geerbt wird. Wenn Sie die Berechtigung nur für derzeit vorhandene Dateien erteilen möchten, wählen Sie einen Zugriffsberechtigungseintrag aus. Um die Berechtigung zum Überprüfen von Dateien und Ordnern zu erteilen, die in Zukunft hinzugefügt werden, schließen Sie einen Standardberechtigungseintrag ein.
Verwenden des Dienstprinzipals für die Überprüfung
Erstellen eines neuen Dienstprinzipals
Wenn Sie einen neuen Dienstprinzipal erstellen müssen, müssen Sie eine Anwendung in Ihrem Azure AD-Mandanten registrieren und Zugriff auf den Dienstprinzipal in Ihren Datenquellen gewähren. Dieser Vorgang kann von Ihrem globalen Azure AD-Administrator oder anderen Rollen wie Anwendungsadministrator ausgeführt werden.
Abrufen der Anwendungs-ID des Dienstprinzipals
Kopieren Sie die Anwendungs-ID (Client-ID), die in der Übersicht über den bereits erstellten Dienstprinzipal vorhanden ist.
Gewähren des Zugriffs auf Ihr ADLS Gen1-Konto für den Dienstprinzipal
Es ist wichtig, Ihrem Dienstprinzipal die Berechtigung zum Überprüfen der ADLS Gen2-Datenquelle zu erteilen. Sie können den Zugriff für den Dienstprinzipal auf Abonnement-, Ressourcengruppen- oder Ressourcenebene hinzufügen, je nachdem, welche Berechtigungen er benötigt.
Hinweis
Sie müssen besitzer des Abonnements sein, um einen Dienstprinzipal zu einer Azure-Ressource hinzufügen zu können.
Gewähren Sie dem Dienstprinzipal Zugriff auf das Speicherkonto, indem Sie das Speicherkonto öffnen und Übersicht -->Data Explorer
Wählen Sie im oberen Navigationsbereich Access aus.
Wählen Sie in der Auswahl Benutzer oder Gruppe auswählen die Option Auswählen und Dienstprinzipal hinzufügen aus.
Wählen Sie Lese - und Ausführungsberechtigungen aus. Stellen Sie sicher, dass Sie dieser Ordner und alle untergeordneten Elemente und ein Zugriffsberechtigungseintrag und einen Standardberechtigungseintrag in den Optionen Hinzufügen auswählen. Wählen Sie OK aus.
Erstellen der Überprüfung
Öffnen Sie Ihr Microsoft Purview-Konto, und wählen Sie das Microsoft Purview-Governanceportal öffnen aus.
Navigieren Sie zu Data map -->Sources , um die Sammlungshierarchie anzuzeigen.
Wählen Sie unter der zuvor registrierten ADLS Gen1-Datenquelle das Symbol "Neue Überprüfung" aus.
Bei Verwendung einer system- oder benutzerseitig zugewiesenen verwalteten Identität
Geben Sie einen Namen für die Überprüfung an, wählen Sie die system- oder benutzerseitig zugewiesene verwaltete Identität unter Anmeldeinformationen aus, wählen Sie die entsprechende Sammlung für die Überprüfung aus, und wählen Sie Verbindung testen aus. Wählen Sie bei erfolgreicher Verbindung Weiter aus.
Bei Verwendung eines Dienstprinzipals
Geben Sie einen Namen für die Überprüfung an, wählen Sie die entsprechende Sammlung für die Überprüfung aus, und wählen Sie unter Anmeldeinformationen die Option + Neu aus.
Wählen Sie die entsprechende Schlüsseltresorverbindung und den Geheimnisnamen aus, die beim Erstellen des Dienstprinzipals verwendet wurden. Die Dienstprinzipal-ID ist die Anwendungs-ID (Client-ID), die wie zuvor angegeben kopiert wurde.
Wählen Sie Verbindung testen aus. Wählen Sie bei erfolgreicher Verbindung Weiter aus.
Eingrenzen und Ausführen der Überprüfung
Sie können ihre Überprüfung auf bestimmte Ordner und Unterordner festlegen, indem Sie die entsprechenden Elemente in der Liste auswählen.
Wählen Sie dann einen Überprüfungsregelsatz aus. Sie können zwischen dem Systemstandard und vorhandenen benutzerdefinierten Regelsätzen wählen oder einen neuen Regelsatz inline erstellen.
Wenn Sie einen neuen Überprüfungsregelsatz erstellen, wählen Sie die Dateitypen aus, die in die Überprüfungsregel eingeschlossen werden sollen.
Sie können die Klassifizierungsregeln auswählen, die in die Überprüfungsregel eingeschlossen werden sollen.
Wählen Sie Ihren Scantrigger aus. Sie können einen Zeitplan einrichten oder die Überprüfung einmal ausführen.
Überprüfen Sie Ihre Überprüfung, und wählen Sie Speichern und ausführen aus.
Anzeigen der Überprüfung
Navigieren Sie zur Datenquelle in der Sammlung, und wählen Sie Details anzeigen aus, um die status der Überprüfung zu überprüfen.
Die Überprüfungsdetails geben den Fortschritt der Überprüfung in der letzten Ausführung status und die Anzahl der überprüften und klassifizierten Ressourcen an.
Die status letzte Ausführung wird in In Bearbeitung und dann auf Abgeschlossen aktualisiert, sobald die gesamte Überprüfung erfolgreich ausgeführt wurde.
Verwalten der Überprüfung
Überprüfungen können verwaltet oder nach Abschluss erneut ausgeführt werden.
Wählen Sie den Scannamen aus, um die Überprüfung zu verwalten.
Sie können die Überprüfung erneut ausführen, die Überprüfung bearbeiten und die Überprüfung löschen.
Hinweis
- Durch das Löschen Ihrer Überprüfung werden keine Katalogressourcen gelöscht, die aus vorherigen Überprüfungen erstellt wurden.
- Das Medienobjekt wird nicht mehr mit Schemaänderungen aktualisiert, wenn sich Ihre Quelltabelle geändert hat und Sie die Quelltabelle erneut überprüfen, nachdem Sie die Beschreibung auf der Registerkarte Schema von Microsoft Purview bearbeitet haben.
Sie können eine inkrementelle Überprüfung oder eine vollständige Überprüfung erneut ausführen.
Nächste Schritte
Nachdem Sie Ihre Quelle registriert haben, folgen Sie den folgenden Anleitungen, um mehr über Microsoft Purview und Ihre Daten zu erfahren.