Ausführen von Verbundabfragen auf Amazon Redshift

Auf dieser Seite wird beschrieben, wie Sie lakehouse Federation einrichten, um Verbundabfragen für Run-Abfragen für Amazon Redshift-Daten auszuführen, die nicht von Azure Databricks verwaltet werden. Weitere Informationen zur Lakehouse Federation finden Sie unter Was ist Lakehouse Federation?

Um eine Verbindung zum Ausführen Ihrer Abfragen in der Amazon Redshift-Datenbank mithilfe der Lakehouse Federation herzustellen, müssen Sie Folgendes in Ihrem Azure Databricks Unity Catalog Metastore erstellen (Arbeitsbereiche, die nach dem 9. November 2023 erstellt wurden, verfügen bereits automatisch über einen Unity Catalog Metastore):

Eine Verbindung mit Ihrer Amazon Redshift-Datenbank
Einen Fremdkatalog, der Ihre Amazon Redshift-Datenbank in Unity Catalog spiegelt, sodass Sie die Abfragesyntax und Datengovernancetools von Unity Catalog zum Verwalten des Azure Databricks-Benutzerzugriffs auf die Datenbank verwenden können.

Vorbereitung

Anforderungen an den Arbeitsbereich:

Der Arbeitsbereich muss für Unity Catalog aktiviert sein. Arbeitsbereiche, die nach dem 9. November 2023 erstellt werden, werden automatisch für Unity Catalog aktiviert, einschließlich der automatischen Bereitstellung des Metastore. Sie müssen keinen Metaspeicher manuell erstellen, es sei denn, Ihr Arbeitsbereich existiert vor der automatischen Aktivierung und Unity Catalog wurde nicht aktiviert. Siehe Automatische Aktivierung des Unity Catalog.

Computeanforderungen:

Netzwerkkonnektivität von Ihrer Rechnerressource zu den Zieldatenbanksystemen. Weitere Informationen finden Sie unter Netzwerkempfehlungen für Lakehouse Federation.
Azure Databricks-Computing muss Databricks Runtime 13.3 LTS oder höher verwenden und im Standard- oder Dediziert-Zugriffsmodus betrieben werden.
SQL-Lagerhäuser müssen pro oder serverlos sein und 2023.40 oder höher verwenden.

Erforderliche Berechtigungen:

Um eine Verbindung zu erstellen, müssen Sie Metastore-Administrator oder Benutzer mit der Berechtigung „CREATE CONNECTION“ für den Unity Catalog-Metastore sein, der an den Arbeitsbereich angefügt ist. In Arbeitsbereichen, die automatisch für Unity-Katalog aktiviert wurden, verfügen Arbeitsbereichsadministratoren standardmäßig über die CREATE CONNECTION Berechtigung.
Um einen Fremdkatalog zu erstellen, müssen Sie über die Berechtigung „CREATE CATALOG“ für den Metastore verfügen und entweder der Besitzer der Verbindung sein oder über die Berechtigung „CREATE FOREIGN CATALOG“ für die Verbindung verfügen. In Arbeitsbereichen, die automatisch für Unity-Katalog aktiviert wurden, verfügen Arbeitsbereichsadministratoren standardmäßig über die CREATE CATALOG Berechtigung.

In jedem folgenden aufgabenbasierten Abschnitt werden zusätzliche Berechtigungsanforderungen angegeben.

Erstellen einer Verbindung

Eine Verbindung gibt einen Pfad und Anmeldeinformationen für den Zugriff auf ein externes Datenbanksystem an. Zum Erstellen einer Verbindung können Sie den Katalog-Explorer oder den SQL-Befehl „CREATE CONNECTION“ in einem Azure Databricks-Notebook oder im Databricks SQL-Abfrage-Editor verwenden.

Note

Sie können auch die Databricks REST-API oder die Databricks CLI verwenden, um eine Verbindung zu erstellen. Weitere Informationen finden Sie unter POST /api/2.1/unity-catalog/connections und Unity Catalog-Befehle.

Erforderliche Berechtigungen: Metastore-Admin oder Benutzer mit der Berechtigung CREATE CONNECTION.

Katalog-Explorer

Klicken Sie im Azure Databricks-Arbeitsbereich auf das Katalog.
Klicken Sie oben im Katalogbereich auf das hinzufügen ", und wählen Sie im Menü " Verbindung erstellen " aus.
Geben Sie auf der Seite Verbindungsdetails des Assistenten zum Einrichten der Verbindung einen benutzerfreundlichen Verbindungsnamen ein.
Wählen Sie als Verbindungstypdie Option Redshift aus.
(Optional) Fügen Sie einen Kommentar hinzu.
Klicke auf Weiter.
Geben Sie auf der Seite Authentication die folgenden Verbindungseigenschaften für Ihre Redshift-Instanz ein.
- Host: Zum Beispiel redshift-demo.us-west-2.redshift.amazonaws.com
- Port: Zum Beispiel 5439
- Benutzer: Zum Beispiel redshift_user
- Kennwort: Zum Beispiel password123
(Optional) SSL-Hostnamenüberprüfung deaktivieren.
Klicken Sie auf Create connection (Verbindung erstellen).
Geben Sie auf der Seite Kataloggrundlagen einen Namen für den Fremdkatalog ein. Ein Fremdkatalog spiegelt eine Datenbank in einem externen Datensystem, sodass Sie Abfragen und die Verwaltung des Zugriffs auf Daten in dieser Datenbank mithilfe von Azure Databricks und Unity Catalog steuern können.
(Optional) Klicken Sie auf Verbindung testen, um zu überprüfen, ob sie funktioniert.
Klicken Sie auf Katalog erstellen.
Wählen Sie auf der Seite Access die Arbeitsbereiche aus, in denen Benutzer auf den von Ihnen erstellten Katalog zugreifen können. Sie können Alle Arbeitsbereiche haben Zugriff oder Arbeitsbereichen zuweisen, anschließend die Arbeitsbereiche und dann Zuweisen auswählen.
Ändern Sie den Eigentümer, der in der Lage sein wird, den Zugriff auf alle Objekte im Katalog zu verwalten. Beginnen Sie mit der Eingabe eines Prinzipals im Textfeld, und wählen Sie den Prinzipal dann in den zurückgegebenen Ergebnissen aus.
Gewähren Sie Berechtigungen für den Katalog. Klicken Sie auf "Zulassen":
1. Geben Sie die Prinzipale an, die Zugriff auf die Objekte im Katalog haben werden. Beginnen Sie mit der Eingabe eines Prinzipals im Textfeld, und wählen Sie den Prinzipal dann in den zurückgegebenen Ergebnissen aus.
2. Wählen Sie die Berechtigungsvoreinstellungen aus, die den einzelnen Prinzipalen gewährt werden sollen. Standardmäßig werden allen Kontobenutzern BROWSE gewährt.
  - Wählen Sie im Dropdownmenü Datenleseberechtigter aus, um read-Berechtigungen für Objekte im Katalog zu gewähren.
  - Wählen Sie Daten-Editor aus dem Dropdownmenü aus, um read und modify Berechtigungen für Objekte im Katalog zu gewähren.
  - Wählen Sie die Berechtigungen manuell aus, die erteilt werden sollen.
3. Klicken Sie auf Gewähren.
Klicke auf Weiter.
Geben Sie auf der Seite Metadaten Schlüssel-Wert-Paare für Tags an. Weitere Informationen finden Sie unter Tags auf sichere Unity Catalog-Objekte anwenden.
(Optional) Fügen Sie einen Kommentar hinzu.
Klicken Sie auf "Speichern".

SQL

Führen Sie in einem Notebook oder im Databricks SQL-Abfrage-Editor den folgenden Befehl aus.

CREATE CONNECTION <connection-name> TYPE redshift
OPTIONS (
  host '<hostname>',
  port '<port>',
  user '<user>',
  password '<password>'
);

Es wird empfohlen, Aure Databricks-Geheimnisse anstelle von Klartext-Zeichenfolgen für vertrauliche Werte wie Anmeldeinformationen zu verwenden. Beispiel:

CREATE CONNECTION <connection-name> TYPE redshift
OPTIONS (
  host '<hostname>',
  port '<port>',
  user secret ('<secret-scope>','<secret-key-user>'),
  password secret ('<secret-scope>','<secret-key-password>')
)

Informationen zum Einrichten von Geheimnissen finden Sie unter Verwaltung von Geheimnissen.

Erstellen eines Fremdkatalogs

Note

Wenn Sie die Benutzeroberfläche zum Erstellen einer Verbindung mit der Datenquelle verwenden, ist die Erstellung fremder Kataloge enthalten, und Sie können diesen Schritt überspringen.

Ein Fremdkatalog spiegelt eine Datenbank in einem externen Datensystem, sodass Sie Abfragen und die Verwaltung des Zugriffs auf Daten in dieser Datenbank mithilfe von Azure Databricks und Unity Catalog steuern können. Um einen fremden Katalog zu erstellen, verwenden Sie eine Verbindung mit der bereits definierten Datenquelle.

Zum Erstellen eines Fremdkatalogs können Sie den Katalog-Explorer oder den SQL-Befehl CREATE FOREIGN CATALOG in einem Azure Databricks-Notebook oder im SQL-Abfrage-Editor verwenden. Sie können auch die Databricks REST-API oder die Databricks CLI verwenden, um einen Katalog zu erstellen. Siehe POST /api/2.1/unity-catalog/catalogs und Unity Catalog Befehle.

Erforderliche Berechtigungen:CREATE CATALOG Berechtigung auf dem Metastore und entweder die Eigentümerschaft an der Verbindung oder die CREATE FOREIGN CATALOG Berechtigung auf der Verbindung.

Katalog-Explorer

Klicken Sie im Azure Databricks-Arbeitsbereich auf das Katalog zum Öffnen des Katalog-Explorers.
Klicken Sie oben im Bereich Katalog auf das Symbol Hinzufügen und wählen Sie im Menü Katalog hinzufügen.

Klicken Sie alternativ auf der Seite Schnellzugriff auf die Schaltfläche Kataloge, und klicken Sie dann auf die Schaltfläche Katalog erstellen.
Befolgen Sie die Anweisungen zum Erstellen von Fremdkataloge unter Erstellen von Katalogen.

SQL

Führen Sie den folgenden SQL-Befehl in einem Notebook oder SQL-Abfrage-Editor aus. Elemente in Klammern sind optional. Ersetzen Sie die folgenden Platzhalterwerte:

<catalog-name>: Name für den Katalog in Azure Databricks.
<connection-name>: Das Verbindungsobjekt, das die Datenquelle, den Pfad und die Anmeldeinformationen angibt.
<database-name>: Name der Datenbank, die Sie als Katalog in Azure Databricks spiegeln möchten.

CREATE FOREIGN CATALOG [IF NOT EXISTS] <catalog-name> USING CONNECTION <connection-name>
OPTIONS (database '<database-name>');

Unterstützte Pushdowns

Die folgenden Pushdowns werden unterstützt:

Filters
Projections
Limit
Joins
Aggregate (Average, Count, Max, Min, StddevPop, StddevSamp, Sum, VarianceSamp)
Funktionen (Zeichenfolgenfunktionen und andere verschiedene Funktionen wie Alias, Cast, SortOrder)
Sorting

Die folgenden Pushdowns werden nicht unterstützt:

Windows-Funktionen

Datentypzuordnungen

Wenn Sie von Amazon Redshift zu Spark lesen, werden die Datentypen wie folgt zugeordnet:

Rotverschiebungstyp	Spark-Typ
numeric	DecimalType
int2, int4	IntegerType
int8, oid, xid	LongType
float4	FloatType
doppelte Genauigkeit, Float8, Geld	DoubleType
bpchar, char, character varying, name, super, text, tid, varchar	StringType
Bytea, Geometrie, Varbyte	BinaryType
bit, bool	BooleanType
date	DateType
tabstime, Zeit, Zeit mit Zeitzone, timetz, Zeit ohne Zeitzone, Zeitstempel mit Zeitzone, Zeitstempel, timestamptz, Zeitstempel ohne Zeitzone*	TimestampType/TimestampNTZType

* Wenn Sie aus Redshift lesen, wird Redshift Timestamp Spark TimestampType zugeordnet wenn infer_timestamp_ntz_type = false (Standard). Amazon Redshift Timestamp wird TimestampNTZType zugeordnet, wenn infer_timestamp_ntz_type = true.

Limitations

Sie können keine Verbundabfragen für externe Amazon Redshift-Daten ausführen.

Feedback

War diese Seite hilfreich?

Last updated on 2026-03-15

Ausführen von Verbundabfragen auf Amazon Redshift

Vorbereitung

Erstellen einer Verbindung

Katalog-Explorer

SQL

Erstellen eines Fremdkatalogs

Katalog-Explorer

SQL

Unterstützte Pushdowns

Datentypzuordnungen

Limitations

Feedback

Zusätzliche Ressourcen