Udostępnij za pośrednictwem


Dostęp i reguły ścieżki w woluminach Unity Catalog

Na tej stronie wyjaśniono ograniczenia związane z nakładaniem się ścieżek w Unity Catalog, wzorce dostępu do plików danych oparte na ścieżkach w obiektach Unity Catalog oraz opisano, jak Unity Catalog zarządza ścieżkami dla tabel i woluminów.

Ograniczenia nakładania się ścieżek w Unity Catalog

Unity Catalog wymusza nadzór nad danymi, uniemożliwiając nakładanie się zarządzanych katalogów danych. Katalog Unity egzekwuje następujące reguły:

  • Lokalizacje zewnętrzne nie mogą nakładać się na inne lokalizacje zewnętrzne.
  • Tabele i woluminy przechowują pliki danych w lokalizacjach zewnętrznych lub lokalizacji głównej magazynu metadanych.
  • Woluminy nie mogą nakładać się na inne woluminy.
  • Tabele nie mogą nakładać się na inne tabele.
  • Tabele i woluminy nie mogą nakładać się na siebie nawzajem.
  • Zarządzane lokalizacje magazynu nie mogą się nakładać na siebie. Zobacz Określanie zarządzanej lokalizacji magazynowej w Unity Catalog.
  • Woluminy zewnętrzne nie mogą nakładać się na zarządzane lokalizacje magazynu.
  • Tabele zewnętrzne nie mogą nakładać się na zarządzane lokalizacje magazynu.

Te reguły oznaczają, że w Unity Catalog istnieją następujące ograniczenia:

  • Nie można zdefiniować lokalizacji zewnętrznej w innej lokalizacji zewnętrznej.
  • Nie można zdefiniować woluminu w innym woluminie.
  • Nie można zdefiniować tabeli w innej tabeli.
  • Nie można zdefiniować tabeli na żadnych plikach danych ani katalogach w woluminie.
  • Nie można zdefiniować wolumenu w folderze w tabeli.

Uwaga / Notatka

Zawsze możesz użyć dostępu opartego na ścieżkach, aby zapisywać lub odczytywać pliki danych z woluminów, w tym usługi Delta Lake. Nie można zarejestrować tych plików danych jako tabel w magazynie Unity Catalog.

W pełni zarządzane ścieżki dla tabel i woluminów

Podczas tworzenia tabeli zarządzanej lub zarządzanego wolumenu Unity Catalog tworzy nowy katalog w skonfigurowanej lokalizacji magazynu skojarzonej ze schematem zawierającym. Nazwa tego katalogu jest generowana losowo, aby uniknąć potencjalnej kolizji z innymi katalogami, które już istnieją. To zachowanie różni się od sposobu tworzenia tabel zarządzanych przez magazyn metadanych Hive.

Dostęp oparty na ścieżkach do tabel zarządzanych w Unity Catalog nie jest obsługiwany. Zawsze korzystaj z tabel zarządzanych przez Unity Catalog przy użyciu ich nazw oraz z woluminów zarządzanych przez Unity Catalog przy użyciu ich ścieżek.

Ścieżki lokalizacji zewnętrznej dla tabel i woluminów

Podczas tworzenia tabeli zewnętrznej lub woluminu należy określić ścieżkę w lokalizacji zewnętrznej zarządzanej przez Unity Catalog.

Ważne

Aby uniknąć konfliktów ścieżek, Databricks zaleca tworzenie tabel zewnętrznych i woluminów w podkatalogach, a nie w katalogu głównym lokalizacji zewnętrznej.

Aby ułatwić korzystanie z tabel zewnętrznych w Unity Catalog, używaj nazw tabel, a dla woluminów zewnętrznych skorzystaj ze ścieżek woluminów. Użytkownicy z wystarczającymi uprawnieniami mogą również uzyskiwać dostęp do danych bezpośrednio przy użyciu pełnej ścieżki magazynu w chmurze.

Dostęp do danych za pośrednictwem adresów URI w chmurze dla tych obiektów jest w pełni zarządzany przez uprawnienia Katalogu Unity, które nadpisują wszelkie uprawnienia w samej lokalizacji zewnętrznej. Zobacz Ograniczenia nakładania się ścieżek w Katalogu Unity i Odwołanie do uprawnień Katalogu Unity.

Uzyskiwanie dostępu do danych w Unity Catalog

Obiekty katalogu Unity zapewniają dostęp do danych za pośrednictwem identyfikatorów obiektów, ścieżek woluminów lub identyfikatorów URI w chmurze. Te wartości umożliwiają uzyskiwanie dostępu do danych skojarzonych z woluminami i tabelami.

Dostęp do tabel Unity Catalog uzyskuje się przy użyciu identyfikatora trójetapowego z następującym wzorcem:

<catalog_name>.<schema_name>.<table_name>

Ścieżki plików woluminów w katalogu Unity Catalog

Woluminy zapewniają ścieżkę pliku w celu uzyskania dostępu do plików danych przy użyciu następującego wzorca:

/Volumes/<catalog_name>/<schema_name>/<volume_name>/<path_to_file>

Identyfikatory URI chmury wymagają od użytkowników podania sterownika, identyfikatora kontenera magazynu i pełnej ścieżki do plików danych, jak pokazano w poniższym przykładzie:

abfss://<container_name>@<storage_account>.dfs.core.windows.net/<path>

W poniższej tabeli przedstawiono dozwolone metody uzyskiwania dostępu do obiektów Unity Catalog.

Przedmiot Identyfikator obiektu Ścieżka pliku Identyfikator URI chmury
Lokalizacja zewnętrzna Nie Nie tak
Zarządzana tabela tak Nie Nie
Tabela zewnętrzna tak Nie tak
Wolumin zarządzany Nie tak Nie
Zewnętrzna objętość Nie tak tak

Uwaga / Notatka

Woluminy katalogu Unity używają trójwarstwowych identyfikatorów obiektów z następującym wzorcem dla komend zarządzania (takich jak CREATE VOLUME i DROP VOLUME).

<catalog_name>.<schema_name>.<volume_name>

Aby faktycznie pracować z plikami w woluminach, należy użyć dostępu opartego na ścieżkach.