Freigeben über


Konfigurieren des Datenzugriffs für die Erfassung

In diesem Artikel wird beschrieben, wie Administrator*innen den Zugriff auf Daten in einem Container in Azure Data Lake Storage Gen2 (ADLS Gen2) konfigurieren können, damit Azure Databricks-Benutzer*innen Daten aus ADLS Gen2 in eine Tabelle in Azure Databricks laden können.

In diesem Artikel werden die folgenden Möglichkeiten zum Konfigurieren des sicheren Zugriffs auf Quelldaten beschrieben:

  • (Empfohlen) Erstellen eines Unity Catalog-Volumes

  • Erstellen eines externen Unity Catalog-Speicherorts mit Speicheranmeldeinformationen

  • Starten einer Computeressource, die einen Dienstprinzipal verwendet

  • Generieren temporärer Anmeldeinformationen (ein Blob-SAS-Token)

Voraussetzungen

Bevor Sie den Zugriff auf Daten in ADLS Gen2 konfigurieren, stellen Sie sicher, dass Sie über Folgendes verfügen:

  • Daten in einem Container in Ihrem Azure Storage-Konto. Informationen zum Erstellen eines Containers finden Sie unter Erstellen eines Containers in der Azure Storage-Dokumentation.

  • Die READ VOLUME-Berechtigung für das Volume für den Zugriff auf Daten mit einem Unity Catalog-Volume. Weitere Informationen finden Sie unter Erstellen und Verwenden von Volumes und Unity Catalog-Berechtigungen und sicherungsfähige Objekte.

  • Die READ FILES-Berechtigung für den externen Speicherort für den Zugriff auf Daten mithilfe des externen Unity Catalog-Speicherorts. Weitere Informationen finden Sie unter Erstellen eines externen Speicherorts zum Verbinden des Cloudspeichers mit Azure Databricks.

  • Administratorberechtigungen für den Azure Databricks-Arbeitsbereich für den Zugriff auf das Dienstprinzipal mithilfe einer Computeressource.

  • So greifen Sie mit temporären Anmeldeinformationen auf Daten zu:

    • Berechtigungen für den*die Azure Databricks-Arbeitsbereichsadministrator*in.
    • Berechtigungen in Ihrem Azure-Konto zum Erstellen von Blob-SAS-Token. Dadurch können Sie temporäre Anmeldeinformationen generieren.
  • Ein Databricks SQL-Warehouse. Informationen zum Erstellen eines SQL-Warehouse finden Sie unter Erstellen eines SQL-Warehouse.

  • Kenntnisse der Benutzeroberfläche des Databricks SQL-Arbeitsbereichs

Konfigurieren des Zugriffs auf Cloudspeicher

Verwenden Sie eine der folgenden Methoden, um den Zugriff auf ADLS Gen2 zu konfigurieren:

Bereinigen

Sie können die zugehörigen Azure Databricks-Ressourcen in Ihrem Arbeitsbereich bereinigen, falls Sie sie nicht länger behalten möchten.

Löschen des Namens des ADLS Gen2-Speicherkontos

  1. Melden Sie sich mit den Anmeldeinformationen Ihres Azure-Kontos bei https://portal.azure.com an.
  2. Navigieren Sie zu Ihrem Speicherkonto, und öffnen Sie es.
  3. Klicken Sie auf Löschen.
  4. Geben Sie den Namen des Kontos ein, und klicken Sie dann auf Löschen.

Beenden des SQL-Warehouse

Wenn Sie das SQL-Warehouse nicht für andere Aufgaben verwenden, sollten Sie es beenden, um zusätzliche Kosten zu vermeiden.

  1. Klicken Sie in der SQL Persona auf der Randleiste auf SQL-Warehouses.
  2. Klicken Sie neben dem Namen des SQL-Warehouse auf Beenden.
  3. Wenn Sie dazu aufgefordert werden, klicken Sie erneut auf Beenden.

Nächste Schritte

Nachdem Sie die Schritte in diesem Artikel ausgeführt haben, können Benutzer*innen den COPY INTO-Befehl ausführen, um die Daten aus dem ADLS Gen2-Container in Ihren Azure Databricks-Arbeitsbereich zu laden.