Anmerkung
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen, dich anzumelden oder die Verzeichnisse zu wechseln.
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen , die Verzeichnisse zu wechseln.
Auf dieser Seite werden Einschränkungen für Pfadüberschneidungen im Unity-Katalog, pfadbasierte Zugriffsmuster für Datendateien in Unity Catalog-Objekten erläutert und beschrieben, wie Unity Catalog Pfade für Tabellen und Volumes verwaltet.
Pfadüberlappungseinschränkungen im Unity-Katalog
Zur Erzwingung von Datengovernance verhindert Unity Catalog, dass sich verwaltete Datenverzeichnisse überschneiden. Unity Catalog erzwingt folgende Regeln:
- Externe Speicherorte können keine anderen externen Speicherorte überlappen.
- Tabellen und Volumes speichern Datendateien an externen Speicherorten oder dem Metastore-Stammspeicherort.
- Volumes können andere Volumes nicht überlappen.
- Tabellen können keine anderen Tabellen überlappen.
- Tabellen und Volumes können sich nicht gegenseitig überlappen.
- Verwaltete Speicherorte können sich nicht gegenseitig überlappen. Weitere Informationen finden Sie unter Angeben eines verwalteten Speicherorts in Unity Catalog.
- Externe Volumes können verwaltete Speicherorte nicht überlappen.
- Externe Tabellen können verwaltete Speicherorte nicht überlappen.
Diese Regeln bedeuten, dass die folgenden Einschränkungen im Unity-Katalog vorhanden sind:
- Sie können keinen externen Speicherort innerhalb eines anderen externen Speicherorts definieren.
- Sie können ein Volume nicht innerhalb eines anderen Volumes definieren.
- Sie können eine Tabelle in einer anderen Tabelle nicht definieren.
- Sie können keine Tabelle für Datendateien oder Verzeichnisse innerhalb eines Volumes definieren.
- Sie können ein Volume in einem Verzeichnis in einer Tabelle nicht definieren.
Hinweis
Sie können jederzeit pfadbasierten Zugriff verwenden, um Datendateien aus Volumes zu schreiben oder zu lesen, einschließlich Delta Lake. Sie können diese Datendateien nicht als Tabellen im Unity Catalog-Metastore registrieren.
Vollständig verwaltete Pfade für Tabellen und Volumes
Wenn Sie eine verwaltete Tabelle oder ein verwaltetes Volume erstellen, erstellt Unity Catalog ein neues Verzeichnis im mit dem enthaltenden Schema verknüpften Unity-Katalogspeicherort. Der Name dieses Verzeichnisses wird zufällig generiert, um potenzielle Konflikte mit anderen bereits vorhandenen Verzeichnissen zu vermeiden. Dieses Verhalten unterscheidet sich davon, wie der Hive-Metaspeicher verwaltete Tabellen erstellt.
Der pfadbasierte Zugriff auf verwaltete Tabellen im Unity-Katalog wird nicht unterstützt. Interagieren Sie immer mit von Unity Catalog verwalteten Tabellen mithilfe von Tabellennamen und von Unity Catalog verwalteten Volumes mithilfe von Volumepfaden.
Pfade für externe Speicherorte für Tabellen und Volumes
Wenn Sie eine externe Tabelle oder ein Externes Volume erstellen, geben Sie einen Pfad innerhalb eines externen Speicherorts an, der vom Unity-Katalog gesteuert wird.
Von Bedeutung
Um Pfadkonflikte zu vermeiden, empfiehlt Databricks das Erstellen externer Tabellen und Volumes in Unterverzeichnissen und nicht am Stamm eines externen Speicherorts.
Um die Benutzerfreundlichkeit zu erleichtern, interagieren Sie mit externen Tabellen im Unity-Katalog mithilfe von Tabellennamen und externen Volumes mithilfe von Volumepfaden. Benutzer mit ausreichenden Berechtigungen können auch direkt über den vollständigen Cloudspeicherpfad auf Daten zugreifen.
Der Zugriff auf Daten über Cloud-URIs für diese Objekte unterliegt vollständig den Unity-Katalogrechten, die alle Berechtigungen für den externen Speicherort selbst außer Kraft setzen. Siehe Path overlap restrictions in Unity Catalog and Unity Catalog privileges and securable objects.
Zugreifen auf Daten im Unity-Katalog
Unity Catalog-Objekte bieten Zugriff auf Daten über Objektbezeichner, Volumepfade oder Cloud-URIs. Sie können diese Werte verwenden, um auf Daten zuzugreifen, die Volumes und Tabellen zugeordnet sind.
Auf Unity-Katalogtabellen wird mithilfe eines dreistufigen Bezeichners mit dem folgenden Muster zugegriffen:
<catalog_name>.<schema_name>.<table_name>
Volumedateipfade im Unity-Katalog
Volumes bieten einen Dateipfad für den Zugriff auf Datendateien mit dem folgenden Muster:
/Volumes/<catalog_name>/<schema_name>/<volume_name>/<path_to_file>
Cloud-URIs erfordern, dass Benutzer den Treiber, den Speichercontainerbezeichner und den vollständigen Pfad zu den Zieldateien bereitstellen, wie im folgenden Beispiel gezeigt:
abfss://<container_name>@<storage_account>.dfs.core.windows.net/<path>
In der folgenden Tabelle sind die Zugriffsmethoden aufgeführt, die für Unity Catalog-Objekte zulässig sind:
| Objekt | Objektbezeichner | Dateipfad | Cloud-URI |
|---|---|---|---|
| Externer Speicherort | nein | nein | ja |
| Verwaltete Tabelle | ja | nein | nein |
| Externe Tabelle | ja | nein | ja |
| Verwaltetes Volume | nein | ja | nein |
| Externes Volume | nein | ja | ja |
Hinweis
Unity Catalog-Volumes verwenden dreistufige Objektbezeichner mit dem folgenden Muster für Verwaltungsbefehle (wie z. B. CREATE VOLUME und DROP VOLUME):
<catalog_name>.<schema_name>.<volume_name>
Um tatsächlich mit Dateien in Volumes zu arbeiten, müssen Sie pfadbasierten Zugriff verwenden.