Zugriff auf Daten, die mithilfe von Delta Sharing für Sie freigegeben wurden (für Empfänger)
In diesem Artikel erfahren Sie, wie Sie auf Daten zugreifen, die mithilfe von Delta Sharing für Sie freigegeben wurden.
Delta Sharing und Datenempfänger
Delta Sharing ist ein offener Standard für die sichere Datenfreigabe. Databricks-Benutzer (Datenanbieter) können mithilfe von Delta Sharing Daten für eine Person oder Gruppe (Datenempfänger) außerhalb ihrer Organisation freigeben.
Databricks-zu-Databricks-Freigabe und offene Freigabe
Wie Sie auf die Daten zugreifen, hängt davon ab, ob Sie selbst Databricks verwenden und ob der Datenanbieter die für Sie freigegebenen Daten für die Databricks-zu-Databricks-Freigabe oder für die offene Freigabe konfiguriert hat.
Beim Databricks-zu-Databricks-Modell müssen Sie ein Benutzer in einem Databricks-Arbeitsbereich mit Unterstützung von Unity Catalog sein. Ein Mitglied Ihres Teams gibt einen eindeutigen Bezeichner für Ihren Unity Catalog Metastore an den Datenanbieter weiter, und der Datenanbieter verwendet diesen, um eine sichere Freigabeverbindung zu erstellen. Die freigegebenen Daten stehen dann in Ihrem Arbeitsbereich zur Verfügung. Bei Bedarf kann ein Mitglied Ihres Teams eine präzise Zugriffssteuerung für diese Daten konfigurieren.
Beim Modell für offene Freigaben können Sie ein beliebiges Tool (einschließlich Databricks) verwenden, um auf die freigegebenen Daten zuzugreifen. Der Datenanbieter sendet Ihnen eine Aktivierungs-URL über einen sicheren Kanal. Die URL führt zu einer herunterladbaren Anmeldeinformationsdatei, die den Zugriff auf die für Sie freigegebenen Daten ermöglicht.
Nutzungsbedingungen
Die freigegebenen Daten werden nicht direkt von Databricks bereitgestellt, sondern von Datenanbietern, die in Azure Databricks ausgeführt werden.
Hinweis
Durch den Zugriff auf die freigegebenen Daten eines Datenanbieters als Datenempfänger gibt dieser an, dass er für den Zugriff auf die vom Datenanbieter bereitgestellten Datenfreigaben autorisiert wurde, und er bestätigt, dass (1) Databricks keine Haftung für solche Daten oder die Verwendung solcher freigegebenen Daten durch den Datenempfänger übernimmt und (2) Databricks Informationen im Zusammenhang mit der Verwendung von und dem Zugriff auf die freigegebenen Daten durch den Datenempfänger sammeln darf (einschließlich der Identifizierung einzelner Personen oder Unternehmen, die mithilfe der Anmeldeinformationsdatei in Verbindung mit solchen Daten auf diese zugreifen) und diese Informationen an den entsprechenden Datenanbieter weitergeben darf.
Erhalten von Zugriff auf die für Sie freigegebenen Daten
Wie Sie auf die Daten zugreifen, hängt davon ab, ob Ihr Datenanbieter die Daten über das Protokoll für offene Freigaben oder über das Databricks-zu-Databricks-Freigabeprotokoll freigegeben hat. Weitere Informationen finden Sie unter Databricks-zu-Databricks-Freigabe und offene Freigabe.
Erhalten von Zugriff im Databricks-zu-Databricks-Modell
Beim Databricks-zu-Databricks-Modell gilt Folgendes:
Der Datenanbieter sendet Ihnen eine Anleitung zur Ermittlung eines eindeutigen Bezeichners für den Unity Catalog-Metastore, der Ihrem Databricks-Arbeitsbereich zugeordnet ist, und Sie senden den eindeutigen Bezeichner an den Datenanbieter.
Der Freigabebezeichner ist eine Zeichenfolge mit der Cloud, der Region und der UUID (eindeutiger Bezeichner für den Metastore) des Metastores im Format
<cloud>:<region>:<uuid>
. Beispiel:aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef
.So rufen Sie den Freigabebezeichner mithilfe des Katalog-Explorers ab
Klicken Sie in Ihrem Azure Databricks-Arbeitsbereich auf Katalog.
Klicken Sie oben im Bereich Katalog auf das Zahnradsymbol , und wählen Sie Delta Sharing aus.
Klicken Sie alternativ auf der Seite Schnellzugriff auf die Schaltfläche Delta Sharing >.
- Klicken Sie rechts oben auf der Registerkarte Für mich freigegeben auf den Namen der Organisation für die Databricks-Freigabe, und wählen Sie Freigabebezeichner kopieren aus.
Wenn Sie den Freigabebezeichner mithilfe eines Notebooks oder einer Databricks SQL-Abfrage abrufen möchten, verwenden Sie die SQL-Standardfunktion
CURRENT_METASTORE
. Bei Verwendung eines Notebooks muss es in einem freigegebenen oder Einzelbenutzer-Cluster in dem Arbeitsbereich ausgeführt werden, den Sie für den Zugriff auf die freigegebenen Daten verwenden werden.SELECT CURRENT_METASTORE();
Der Datenanbieter erstellt Folgendes:
- Einen Empfänger in seinem Databricks-Konto, der Sie und die Benutzer in Ihrer Organisation darstellt, die auf die Daten zugreifen.
- Ein Freigabe, bei der es sich um eine Darstellung der Tabellen, Volumes und Ansichten handelt, die für Sie freigegeben werden sollen.
Sie greifen auf die für Sie freigegebenen Daten zu. Bei Bedarf kann für Ihre Benutzer ein präziser Datenzugriff konfiguriert werden (entweder von Ihnen selbst oder von einem Mitglied Ihres Teams). Weitere Informationen finden Sie unter Lesen von per Databricks-zu-Databricks Delta Sharing freigegebenen Daten (für Empfänger).
Erhalten von Zugriff im Modell für offene Freigaben
Beim Modell für offene Freigaben gilt:
Der Datenanbieter erstellt Folgendes:
- Einen Empfänger in seinem Databricks-Konto, der Sie und die Benutzer in Ihrer Organisation darstellt, die auf die Daten zugreifen. Im Rahmen dieser Konfiguration werden ein Token und eine Anmeldeinformationsdatei generiert.
- Eine Freigabe. Hierbei handelt es sich um eine Darstellung der Tabellen und Partitionen, die für Sie freigegeben werden.
Der Datenanbieter sendet Ihnen eine Aktivierungs-URL über einen sicheren Kanal. Die URL führt zu einer herunterladbaren Anmeldeinformationsdatei, die den Zugriff auf die für Sie freigegebenen Daten ermöglicht.
Wichtig
Geben Sie den Aktivierungslink nicht an Dritte weiter. Eine Anmeldeinformationsdatei kann nur einmal heruntergeladen werden. Wenn Sie den Aktivierungslink erneut verwenden, nachdem die Anmeldeinformationsdatei bereits heruntergeladen wurde, ist die Schaltfläche Anmeldeinformationsdatei herunterladen deaktiviert.
Wenn Sie den Aktivierungslink vor der Verwendung verlieren, wenden Sie sich an den Datenanbieter.
Speichern Sie die Anmeldeinformationsdatei an einem sicheren Ort.
Geben Sie die Anmeldeinformationsdatei nicht an Personen außerhalb der Gruppe von Benutzern weiter, die Zugriff auf die freigegebenen Daten haben sollen. Wenn Sie sie an eine Person in Ihrer Organisation weitergeben müssen, empfiehlt Databricks die Verwendung eines Kennwort-Managers.
Lesen der freigegebenen Daten
Wie Sie Daten lesen, die mithilfe von Delta Sharing auf sichere Weise für Sie freigegeben wurden, hängt davon ab, ob Sie eine Anmeldeinformationsdatei erhalten haben (Modell für offene Freigaben) oder ob Sie einen Databricks-Arbeitsbereich verwenden und Ihren Freigabebezeichner an den Datenanbieter übermittelt haben (Databricks-zu-Databricks-Modell).
Lesen freigegebener Daten unter Verwendung einer Anmeldeinformationsdatei (offene Freigabe)
Wenn Daten für Sie mithilfe des Delta Sharing-Protokolls für offene Freigaben freigegeben wurden, verwenden Sie die zuvor heruntergeladene Anmeldeinformationsdatei, um sich bei dem Databricks-Konto des Datenanbieters zu authentifizieren und die freigegebenen Daten zu lesen. Der Zugriff wird beibehalten, solange das zugrunde liegende Token gültig ist und der Anbieter die Daten weiterhin freigibt. Anbieter verwalten den Ablauf und die Rotation von Token. Änderungen an den Daten stehen Ihnen nahezu in Echtzeit zur Verfügung. Sie können die freigegebenen Daten lesen und kopieren, aber Sie können die Quelldaten nicht ändern.
Informationen zum Zugreifen auf freigegebene Daten sowie zum Lesen freigegebener Daten in Azure Databricks, Apache Spark, Pandas und Power BI finden Sie unter Lesen von Daten, die über das Delta Sharing-Protokoll für offene Freigaben (für Empfänger) freigegeben wurden.
Lesen freigegebener Daten unter Verwendung der Databricks-zu-Databricks-Freigabe
Wenn Daten mit dem Databricks-to-Databricks-Modell für Sie freigegeben wurden, wird für den Zugriff auf die freigegebenen Daten keine Anmeldeinformationsdatei benötigt. Databricks kümmert sich um die sichere Verbindung, und die freigegebenen Daten stehen automatisch in Ihrem Databricks-Arbeitsbereich zur Verfügung.
Informationen zum Suchen, Lesen und Verwalten dieser freigegebenen Daten in Ihrem Databricks-Arbeitsbereich finden Sie unter Lesen von per Databricks-zu-Databricks Delta Sharing freigegebenen Daten (für Empfänger).
Überwachen der Nutzung freigegebener Daten
Wenn Sie Zugriff auf einen Azure Databricks-Arbeitsbereich haben, können Sie Azure Databricks-Überwachungsprotokolle verwenden, um zu verstehen, wer in Ihrer Organisation mithilfe von Delta Sharing auf welche Daten zugreift. Weitere Informationen unter Überwachen der Datenfreigabe.