Erstellen eines externen Speicherorts zum Verbinden des Cloudspeichers mit Azure Databricks
In diesem Artikel wird beschrieben, wie Sie einen externen Speicherort in Unity Catalog zum Verbinden des Cloudspeichers mit Azure Databricks konfigurieren.
Externe Speicherorte ordnen Unity Catalog-Speicheranmeldeinformationen Cloudobjektspeichercontainern zu. Externe Speicherorte werden verwendet, um verwaltete Speicherorte für Kataloge und Schemas zu definieren und Speicherorte für externe Tabellen und externe Volumes zu definieren.
Sie können einen externen Speicherort erstellen, der auf den Speicher in einem Azure Data Lake Storage Gen2-Speichercontainer oder Cloudflare R2-Bucket verweist.
Sie können einen externen Speicherort mithilfe des Katalog-Explorers, der Databricks CLI, SQL-Befehlen in einem Notebook oder einer Databricks SQL-Abfrage oder Terraform erstellen.
Hinweis
Wenn Sie ein Volume definieren, wird der Cloud-URI-Zugriff auf Daten im Volumepfad durch die Berechtigungen des Volumes gesteuert.
Vorbemerkungen
Voraussetzungen:
Sie müssen den Azure Data Lake Storage Gen2-Speichercontainer oder Cloudflare R2-Bucket erstellen, den Sie als externen Speicherort verwenden möchten, bevor Sie das externe Standortobjekt in Azure Databricks erstellen.
Azure Data Lake Storage Gen2-Speicherkonten, die Sie als externe Speicherorte verwenden, müssen über einen hierarchischen Namespace verfügen.
Sie müssen über eine in Azure Databricks definierte Speicheranmeldeinformationen verfügen, die Zugriff auf den Pfad des Cloudspeicherorts erhalten. Weitere Informationen finden Sie unter Erstellen von Speicheranmeldeinformationen zum Herstellen einer Verbindung mit Azure Data Lake Storage Gen2 und Erstellen von Speicheranmeldeinformationen zum Herstellen einer Verbindung mit Cloudflare R2.
Berechtigungsanforderungen:
- Sie müssen sowohl für den Metaspeicher als auch für die Speicheranmeldung, auf die im externen Speicherort verwiesen wird, die Berechtigung
CREATE EXTERNAL LOCATION
besitzen. Metastore-Administrator*innen haben standardmäßig die BerechtigungCREATE EXTERNAL LOCATION
im Metastore.
Erstellen eines externen Speicherorts mithilfe des Katalog-Explorers
Sie können manuell einen externen Speicherort mithilfe des Catalog-Explorers erstellen.
Berechtigungen und Voraussetzungen: Siehe "Bevor Sie beginnen".
So erstellen Sie den externen Speicherort
Melden Sie sich bei einem Arbeitsbereich an, der dem Metastore angefügt ist.
Klicken Sie in der Seitenleiste auf Katalog.
Klicken Sie auf die Schaltfläche + Hinzufügen und wählen Sie Externen Speicherort hinzufügen aus.
Geben Sie den Namen des externen Speicherorts ein.
Kopieren Sie optional den Containerpfad von einem vorhandenen Bereitstellungspunkt (nur Azure Data Lake Storage Gen2-Container).
Wenn Sie nicht von einem vorhandenen Bereitstellungspunkt kopieren, verwenden Sie das Feld URL, um den Speichercontainerpfad oder R2-Bucketpfad einzugeben, der als externer Speicherort verwendet werden soll.
Zum Beispiel:
abfss://my-container-name@my-storage-account.dfs.core.windows.net/<path>
oderr2://my-bucket@my-account-id.r2.cloudflarestorage.com/<path>
.Wählen Sie die Speicheranmeldeinformationen aus, die Zugriff auf den externen Speicherort gewähren.
(Optional:) Wenn Benutzer*innen schreibgeschützten Zugriff auf den externen Speicherort haben sollen, klicken Sie auf Erweiterte Optionen, und wählen Sie Schreibgeschützt aus. Weitere Informationen finden Sie unter Markieren eines externen Speicherorts als schreibgeschützt.
Klicken Sie auf Erstellen.
Erteilen Sie die Berechtigung für die Verwendung des externen Speicherorts.
Wenn eine Person den externen Speicherort verwenden soll, müssen Sie Berechtigungen erteilen:
- Um den externen Speicherort als verwalteten Speicherort für einen Metastore, einen Katalog oder ein Schema hinzuzufügen, erteilen Sie die Berechtigung
CREATE MANAGED LOCATION
. - Um externe Tabellen oder Volumes zu erstellen, erteilen Sie
CREATE EXTERNAL TABLE
oderCREATE EXTERNAL VOLUME
.
So verwenden Sie den Katalog-Explorer zum Erteilen von Berechtigungen
- Klicken Sie auf den Namen des externen Speicherorts, um den Detailbereich zu öffnen.
- Klicken Sie auf der Registerkarte Berechtigungen auf Erteilen.
- Wählen Sie im Dialogfeld Erteilen für
<external location>
Benutzer*innen, Gruppen oder Dienstprinzipale im Feld Prinzipale aus, und wählen Sie dann die Berechtigungen aus, die Sie erteilen möchten. - Klicken Sie auf Erteilen.
- Um den externen Speicherort als verwalteten Speicherort für einen Metastore, einen Katalog oder ein Schema hinzuzufügen, erteilen Sie die Berechtigung
Erstellen eines externen Speicherorts mithilfe von SQL
Führen Sie zum Erstellen eines externen Speicherorts mit SQL den folgenden Befehl in einem Notebook oder dem SQL-Abfrage-Editor aus. Ersetzen Sie die folgenden Platzhalterwerte.
Berechtigungen und Voraussetzungen: Siehe "Bevor Sie beginnen".
<location-name>
: Ein Name für den externen Speicherort. Wennlocation_name
Sonderzeichen wie Bindestriche (-
) enthält, muss es von Backticks (` `
) umgeben sein. Siehe Namen.<bucket-path>
: Der Pfad in Ihrem Cloudmandanten, auf den dieser externe Speicherort Zugriff gewährt. Zum Beispiel:abfss://my-container-name@my-storage-account.dfs.core.windows.net/<path>
oderr2://my-bucket@my-account-id.r2.cloudflarestorage.com/<path>
.<storage-credential-name>
: Der Name der Speicheranmeldeinformationen, die das Lesen aus und Schreiben in den Speichercontainer oder Bucketpfad autorisieren. Wenn der Name der Speicheranmeldeinformationen Sonderzeichen enthält, z. B. Bindestriche (-
), muss er von Backticks (` `
) umgeben sein.
CREATE EXTERNAL LOCATION [IF NOT EXISTS] `<location-name>`
URL '<bucket-path>'
WITH ([STORAGE] CREDENTIAL `<storage-credential-name>`)
[COMMENT '<comment-string>'];
Nächste Schritte
- Erteilen Sie anderen Benutzern die Berechtigung, externe Speicherorte zu verwenden. Siehe Verwalten externer Speicherorte.
- Definieren Sie verwaltete Speicherorte mithilfe externer Speicherorte. Weitere Informationen finden Sie unter Angeben eines verwalteten Speicherorts in Unity Catalog.
- Definieren Sie externe Tabellen mithilfe externer Speicherorte. Weitere Informationen finden Sie unter Erstellen einer externen Tabelle.
- Definieren Sie externe Volumes mithilfe externer Speicherorte. Weitere Informationen finden Sie unter Erstellen von und Arbeiten mit Volumes.
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für