Zarządzane a zewnętrzne woluminy
W tym artykule omówiono różnice między woluminami zarządzanymi i woluminami zewnętrznymi oraz przyczyny, dla których można użyć woluminów zewnętrznych. Usługa Databricks zaleca woluminy zarządzane jako najprostsze rozwiązanie do przechowywania i zarządzania dostępem do danych innych niż tabelaryczne.
Aby uzyskać więcej wskazówek dotyczących konfigurowania dostępu do magazynu obiektów w chmurze przy użyciu wykazu aparatu Unity, zobacz Łączenie się z magazynem obiektów w chmurze i usługami przy użyciu wykazu aparatu Unity.
Różnice zachowania między woluminami zarządzanymi i zewnętrznymi
Woluminy zarządzane i zewnętrzne zapewniają niemal identyczne środowiska podczas korzystania z narzędzi, interfejsów użytkownika i interfejsów API usługi Azure Databricks. Poniżej przedstawiono różnice między tymi typami woluminów.
Woluminy zarządzane zapewniają w pełni zarządzane środowisko magazynu. Oznacza to, że:
- Wszystkie interakcje z plikami w woluminach zarządzanych muszą przejść przez wykaz aparatu Unity.
- Katalog nazewnictwa i układu danych jest zarządzany przez wykaz aparatu Unity. Nazwy katalogów obejmują skróty, aby uniknąć konfliktów na źródłowych kontach magazynu obiektów w chmurze.
- Po usunięciu woluminu zarządzanego usługa Azure Databricks usunie bazowe dane w ciągu 30 dni.
Woluminy zewnętrzne umożliwiają zarządzanie danymi w magazynie obiektów w chmurze. Oznacza to, że:
- Identyfikatory URI w chmurze można używać w usłudze Azure Databricks lub systemach zewnętrznych do interakcji z plikami w woluminach zewnętrznych.
- Wszystkie katalogi utworzone w woluminie zewnętrznym lub przekazanych plikach są względem określonego
LOCATION
podczas tworzenia. - Usunięcie woluminu zewnętrznego spowoduje usunięcie woluminu z wykazu aparatu Unity, ale bazowe dane pozostają niezmienione w lokalizacji zewnętrznej.
Dlaczego warto używać woluminów zewnętrznych?
Woluminy zewnętrzne umożliwiają dodawanie ładu danych wykazu aparatu Unity do istniejących katalogów magazynu obiektów w chmurze. Niektóre przypadki użycia woluminów zewnętrznych obejmują następujące elementy:
- Dodawanie ładu do plików danych bez migracji.
- Zarządzanie plikami utworzonymi przez inne systemy, które muszą być pozyskiwane lub uzyskiwane przez usługę Azure Databricks.
- Zarządzanie danymi utworzonymi przez usługę Azure Databricks, które muszą być dostępne bezpośrednio z magazynu obiektów w chmurze przez inne systemy.
Usługa Databricks zaleca używanie woluminów zewnętrznych do przechowywania plików danych innych niż tabelaryczne, które są odczytywane lub zapisywane przez systemy zewnętrzne oprócz usługi Azure Databricks. Wykaz aparatu Unity nie zarządza odczytami i zapisami wykonywanymi bezpośrednio względem magazynu obiektów w chmurze z systemów zewnętrznych, dlatego należy skonfigurować dodatkowe zasady i poświadczenia na koncie w chmurze, aby upewnić się, że zasady ładu danych są przestrzegane poza usługą Azure Databricks.