Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
W tym artykule wyjaśniono, jak zacząć korzystanie z Unity Catalog w celu zarządzania danymi w środowisku pracy Azure Databricks. Jest to przeznaczone głównie dla administratorów obszarów roboczych, którzy korzystają z Katalogu Unity po raz pierwszy. Aby skonfigurować Unity Catalog przy użyciu dostawcy Terraform dla usługi Databricks, zobacz Automate Unity Catalog setup using Terraform.
Na końcu tego artykułu będziesz mieć następujące elementy:
- Obszar roboczy, który jest obsługiwany przez Unity Catalog.
- Obliczenia mające dostęp do Unity Catalog.
- Użytkownicy z uprawnieniami do dostępu i tworzenia obiektów w katalogu Unity.
Możesz również przejrzeć inne artykuły wprowadzające:
- Aby zapoznać się z szybkim samouczkiem dotyczącym tworzenia tabeli i udzielania uprawnień w Katalogu Unity, zobacz Samouczek: Utwórz swoją pierwszą tabelę i przyznaj uprawnienia.
- Aby zapoznać się z kluczowymi pojęciami dotyczącymi Unity Catalog oraz wprowadzeniem do jego działania, zobacz Co to jest Unity Catalog?.
- Aby dowiedzieć się, jak optymalnie korzystać z katalogu Unity w celu spełnienia potrzeb związanych z zarządzaniem danymi, zobacz najlepsze praktyki w katalogu Unity.
- Jeśli musisz uaktualnić istniejący obszar roboczy nienależący do Unity Catalog do Unity Catalog, zobacz Uaktualnianie obszarów roboczych usługi Azure Databricks do Unity Catalog.
Note
Jeśli chcesz uaktualnić istniejący obszar roboczy nienależący doUnity-Catalog do Unity Catalog, możesz skorzystać z UCX, projektu Databricks Labs, który udostępnia zestaw przepływów pracy i narzędzi do uaktualniania tożsamości, uprawnień i tabel do Unity Catalog. Zobacz Użyj narzędzi UCX, aby zaktualizować obszar roboczy do katalogu Unity
Jak zacząć korzystać z katalogu Unity?
Ścieżka rozpoczynania pracy z Katalogiem Unity jest uzależniona od Twojego obszaru roboczego.
W przypadku nowych obszarów roboczych:
W większości przypadków Unity Catalog jest domyślnie włączony podczas tworzenia obszaru roboczego. Możesz rozpocząć korzystanie z Katalogu Unity z ustawieniami domyślnymi. Istnieją jednak opcjonalne konfiguracje, które można włączyć. Ta strona zawiera omówienie obu tych elementów.
W przypadku istniejących obszarów roboczych:
Upewnij się, że twój obszar roboczy jest funkcjonujący z Unity Catalog.
Jeśli obszar roboczy został utworzony przed automatycznym włączeniem Unity Catalog, administrator konta musi włączyć Unity Catalog. Włączenie Unity Catalog zasadniczo oznacza utworzenie metastore Unity Catalog w regionie twojego obszaru roboczego oraz potwierdzenie, że wszystkie grupy utworzone w obszarze roboczym są konwertowane na grupy działające na poziomie konta.
Uaktualnij tabele zarejestrowane w lokalnym magazynie metadanych Hive w twoim obszarze roboczym do Katalogu Unity.
Można stopniowo uaktualniać, współdziałając tabele zarejestrowane w magazynie metadanych Hive, aby mogły być zarządzane przez Katalog Unity i aby uzyskać do nich dostęp przy użyciu interfejsów i składni Katalogu Unity.
Zobacz Uaktualnienie obszarów roboczych Azure Databricks do Unity Catalog.
Automatyczne włączanie katalogu Unity
Usługa Databricks zaczęła automatycznie włączać nowe obszary robocze dla Unity Catalog od 9 listopada 2023 r., a wdrożenie przebiega stopniowo w obrębie kont. Obszary robocze, które zostały włączone automatycznie, mają następujące właściwości:
Automatycznie tworzony magazyn Unity Catalog (chyba że magazyn Unity Catalog już istniał dla regionu obszaru roboczego i magazyn jest włączony na potrzeby automatycznego przypisywania obszaru roboczego).
Domyślne uprawnienia dla administratorów obszaru roboczego, takie jak możliwość tworzenia wykazu lub zewnętrznego połączenia z bazą danych.
Brak administratora magazynu metadanych (chyba że użyto istniejącego magazynu metadanych z Unity Catalog i administrator magazynu metadanych został już przypisany).
Brak storage na poziomie metastore dla zarządzanych tabel i zarządzanych woluminów (chyba że używany był istniejący metastore Unity Catalog ze storage na poziomie metastore).
Katalog obszarów roboczych , który, gdy zostanie pierwotnie utworzony, jest nazwany na podstawie twojego obszaru roboczego.
Wszyscy użytkownicy w swoim obszarze roboczym mogą tworzyć zasoby w schemacie
defaultw tym wykazie. Domyślnie ten wykaz jest powiązany z obszarem roboczym, co oznacza, że dostęp do niego można uzyskać tylko za pośrednictwem obszaru roboczego. Automatyczne udostępnianie katalogu obszarów roboczych podczas tworzenia obszaru roboczego jest stopniowo wdrażane na wszystkich kontach.Katalog przestrzeni roboczych jest wspierany przez zarządzane miejsce przechowywania. Umożliwia to tworzenie zarządzanych tabel i woluminów w katalogu obszarów roboczych. Zarządzana lokalizacja magazynu znajduje się w zewnętrznej lokalizacji magazynu z poświadczeniem magazynu ograniczonym tylko do określonej ścieżki katalogu obszarów roboczych. To poświadczenie magazynu nie może uzyskać dostępu do innych ograniczonych ścieżek na koncie magazynu obszaru roboczego, takich jak root DBFS lub dane systemowe obszaru roboczego. Ma to na celu zapewnienie bezpieczeństwa i uniemożliwienie nieautoryzowanego dostępu do poufnych danych obszaru roboczego.
Te domyślne konfiguracje będą działać dobrze w przypadku większości obszarów roboczych, ale wszystkie te konfiguracje mogą być modyfikowane przez administratora obszaru roboczego lub administratora konta. Na przykład administrator konta może przypisać administratora magazynu metadanych i utworzyć magazyn na poziomie magazynu metadanych, a administrator obszaru roboczego może zmodyfikować nazwę katalogu obszarów roboczych i dostęp.
Co zrobić, jeśli mój obszar roboczy nie został automatycznie włączony dla Unity Catalog?
Jeśli obszar roboczy nie został włączony automatycznie dla Unity Catalog, administrator konta lub administrator metastore musi samodzielnie dołączyć obszar roboczy do metastore Unity Catalog w tym samym regionie. Jeśli w regionie nie istnieje metamagazyn Unity Catalog, administrator konta musi go utworzyć. Aby uzyskać instrukcje, zobacz Utwórz metastore Unity Catalog.
Jak sprawdzić, czy mój obszar roboczy został włączony w Unity Catalog?
Aby sprawdzić, czy Twój obszar roboczy jest włączony dla Unity Catalog, poproś administratora obszaru roboczego usługi Azure Databricks lub administratora konta o weryfikację. Zobacz również Krok 1: Upewnij się, że obszar roboczy ma włączoną funkcję Unity Catalog.
Jak sprawdzić, czy mój obszar roboczy zawiera katalog obszarów roboczych ?
Niektóre nowe obszary robocze mają katalog obszarów roboczych, który po pierwotnym dostarczeniu jest nazywany po nazwie twojego obszaru roboczego. Aby określić, czy obszar roboczy ma jeden, kliknij Wykaz na pasku bocznym, aby otworzyć Eksploratora wykazu, i wyszukaj katalog, który używa nazwy obszaru roboczego jako nazwy wykazu.
Note
Katalog obszaru roboczego jest jak każdy inny katalog w Unity Catalog; administrator obszaru roboczego może zmienić jego nazwę, zmienić właściciela, a nawet go usunąć. Jednak natychmiast po utworzeniu obszaru roboczego nosi nazwę obszaru roboczego
Zanim rozpoczniesz
Przed rozpoczęciem zadań opisanych w tym artykule należy zapoznać się z podstawowymi pojęciami dotyczącymi katalogu Unity, w tym z metasklepami, rolami administratora i zarządzanym magazynem danych. Zobacz Co to jest Unity Catalog?.
Należy również potwierdzić, że spełniasz następujące wymagania:
Obszar roboczy usługi Azure Databricks w planie Premium.
Następujące role i uprawnienia zależą od stanu obszaru roboczego:
Administrator obszaru roboczego: Jeśli Twój obszar roboczy został automatycznie włączony dla Unity Catalog podczas jego tworzenia, musisz być administratorem obszaru roboczego, aby wykonać wymagane zadania.
Administrator konta: jeśli obszar roboczy nie jest jeszcze włączony dla Unity Catalogu, administrator konta musi przypisać obszar roboczy do magazynu metadanych.
Jeśli w tym samym regionie co obszar roboczy nie ma magazynu Unity Catalog, administrator konta musi również utworzyć magazyn Unity Catalog.
Instrukcje dotyczące określania, czy magazyn metadanych istnieje dla regionu obszaru roboczego, wraz z instrukcjami dotyczącymi tworzenia magazynu metadanych, postępuj zgodnie z tym artykułem.
Zobacz uprawnienia administratora w katalogu aparatu Unity i automatyczne włączanie katalogu aparatu Unity.
Krok 1. Upewnij się, że twój obszar roboczy jest włączony dla Unity Catalog.
W tym kroku określasz, czy twój obszar roboczy jest już skonfigurowany dla Unity Catalog, co oznacza, że magazyn danych Unity Catalog jest dołączony do obszaru roboczego. Jeśli Twój obszar roboczy nie jest aktywowany dla Unity Catalog, musisz ręcznie aktywować swój obszar roboczy dla Unity Catalog. Zobacz Uaktualnienie obszarów roboczych Azure Databricks do Unity Catalog.
Aby potwierdzić, wykonaj jedną z następujących czynności.
Użyj konsoli konta, aby potwierdzić aktywację Unity Catalog
- Jako administrator konta usługi Azure Databricks zaloguj się do konsoli konta.
- Kliknij
Obszary robocze.
- Znajdź obszar roboczy i sprawdź kolumnę w magazynie metadanych. Jeśli nazwa magazynu metadanych jest obecna, obszar roboczy jest dołączony do magazynu metadanych Unity Catalog i dlatego jest włączony do Unity Catalog.
Uruchom zapytanie SQL, aby potwierdzić włączenie Unity Catalog
Uruchom następujące zapytanie SQL w edytorze zapytań SQL lub notesie dołączonym do zasobu obliczeniowego obsługującego wykaz aparatu Unity. Żadna rola administratora nie jest wymagana.
SELECT CURRENT_METASTORE();
Jeśli zapytanie zwraca identyfikator magazynu metadanych jak poniżej, oznacza to, że obszar roboczy jest dołączony do magazynu metadanych Unity Catalog i jest włączony dla Unity Catalog.
Następne kroki, jeśli obszar roboczy nie jest włączony dla Unity Catalog
Jeśli obszar roboczy nie jest włączony dla Unity Catalog (połączony z magazynem metadanych), postępuj zgodnie z instrukcjami w temacie Uaktualnianie obszarów roboczych usługi Azure Databricks do Unity Catalog.
Gdy twój obszar roboczy jest włączony dla Katalogu Unity, przejdź do następnego kroku.
Krok 2. Dodawanie użytkowników i przypisywanie roli administratora obszaru roboczego
Użytkownik, który tworzy obszar roboczy, jest automatycznie dodawany jako użytkownik obszaru roboczego z rolą administratora obszaru roboczego (czyli użytkownik w admins grupie lokalnej obszaru roboczego). Jako administrator obszaru roboczego możesz dodawać i zapraszać użytkowników do obszaru roboczego, przypisywać rolę administratora obszaru roboczego innym użytkownikom i tworzyć jednostki usługi i grupy.
Administratorzy konta mają również możliwość dodawania użytkowników, jednostek usługi i grup do obszaru roboczego. Mogą przyznać role administratora konta i administratora magazynu metadanych.
Aby uzyskać szczegółowe informacje, zobacz Zarządzanie użytkownikami.
(zalecane) Synchronizuj tożsamości na poziomie konta z Microsoft Entra ID
Zarządzanie dostępem użytkowników do usługi Azure Databricks może być wygodne, konfigurując aprowizację za pomocą identyfikatora Entra firmy Microsoft. Aby uzyskać pełne instrukcje, zobacz Synchronizuj użytkowników i grupy z Microsoft Entra ID przy użyciu SCIM.
Krok 3. Tworzenie klastrów lub magazynów SQL, których użytkownicy mogą używać do uruchamiania zapytań i tworzenia obiektów
Aby uruchamiać zadania Unity Catalog, zasoby obliczeniowe muszą być zgodne z pewnymi wymaganiami dotyczącymi bezpieczeństwa. Niezgodne zasoby obliczeniowe nie mogą uzyskać dostępu do danych ani innych obiektów w katalogu Unity. Magazyny SQL zawsze spełniają wymagania Unity Catalog, ale niektóre tryby dostępu do klastrów nie spełniają wymagań. Zobacz Tryby dostępu.
Jako administrator obszaru roboczego możesz zdecydować się na tworzenie zasobów obliczeniowych ograniczonych do administratorów lub zezwolić użytkownikom na tworzenie własnych magazynów SQL i klastrów. Można również utworzyć polityki klastra, które umożliwiają użytkownikom tworzenie własnych klastrów, używając specyfikacji zgodnych ze specyfikacjami katalogu Unity, które narzucasz. Zobacz Uprawnienia obliczeniowe i Tworzenie zasad obliczeniowych i zarządzanie nimi.
Krok 4. Udzielanie uprawnień użytkownikom
Aby tworzyć obiekty i uzyskiwać do nich dostęp w katalogach i schematach Unity Catalog, użytkownik musi mieć do tego uprawnienia. W tej sekcji opisano uprawnienia użytkownika i administratora przyznane domyślnie w niektórych obszarach roboczych i opisano sposób udzielania dodatkowych uprawnień.
Domyślne uprawnienia użytkownika
Niektóre obszary robocze mają uprawnienia użytkownika domyślnego (innego niż administrator) podczas uruchamiania:
Jeśli obszar roboczy został uruchomiony przy użyciu automatycznie skonfigurowanego katalogu obszarów roboczych, wszyscy użytkownicy obszaru roboczego mogą tworzyć obiekty w schemacie katalogu
default.Aby dowiedzieć się, jak określić, czy obszar roboczy ma wykaz obszarów roboczych, zobacz Jak sprawdzić, czy mój obszar roboczy zawiera wykaz obszarów roboczych?.
Jeśli obszar roboczy został włączony ręcznie dla Unity Catalog, ma on katalog
mainaprowizowany automatycznie.Użytkownicy obszaru roboczego mają
USE CATALOGuprawnienia do katalogumain, które nie przyznają możliwości tworzenia ani wybierania z żadnych obiektów w katalogu, ale są wymaganiem wstępnym do pracy z dowolnymi obiektami w katalogu. Użytkownik, który utworzył magazyn metadanych, jest właścicielem katalogumaindomyślnie i może przenieść własność i udzielić dostępu innym użytkownikom.Jeśli magazyn metadanych zostanie dodany po jego utworzeniu, nie zostanie zainicjowany żaden katalog
main.
Inne obszary robocze nie mają katalogów utworzonych domyślnie i domyślnie nie są włączone żadne uprawnienia użytkownika niebędącego administratorem. Administrator obszaru roboczego musi utworzyć pierwszy wykaz i udzielić użytkownikom dostępu do niego oraz obiektów w nim. Przejdź do Krok 5. Tworzenie nowych katalogów i schematów przed wykonaniem kroków opisanych w tej sekcji.
Domyślne uprawnienia administratora
Niektóre obszary robocze mają domyślne uprawnienia administratora obszaru roboczego po uruchomieniu:
- Jeśli obszar roboczy został automatycznie włączony dla Unity Catalog:
- Administratorzy obszaru roboczego mogą tworzyć nowe katalogi i obiekty w nowych katalogach i udzielać im dostępu.
- Domyślnie nie ma administratora metastore.
- Administratorzy obszaru roboczego posiadają wykaz obszarów roboczych (jeśli istnieje) i mogą udzielić dostępu do tego wykazu i wszystkich obiektów w tym wykazie.
- Jeśli obszar roboczy został ręcznie aktywowany dla Unity Catalog:
- Administratorzy obszaru roboczego nie mają domyślnie specjalnych uprawnień Unity Catalog.
- Administratorzy magazynu metadanych są niezbędni i mogą utworzyć dowolny obiekt w Unity Catalog oraz mogą przejąć własność dowolnego obiektu w Unity Catalog.
Aby uzyskać listę dodatkowych uprawnień obiektów przyznanych administratorom obszarów roboczych w obszarach roboczych Unity Catalog, które są automatycznie włączane, zobacz uprawnienia administratora obszaru roboczego, gdy obszary robocze są automatycznie włączone dla Unity Catalog.
Udzielanie uprawnień
Aby uzyskać dostęp do obiektów innych niż wymienione w poprzednich sekcjach, uprzywilejowany użytkownik musi przyznać ten dostęp.
Aby na przykład przyznać grupie możliwość tworzenia nowych schematów w my-catalog, właściciel katalogu może uruchomić następujące polecenie w Edytorze SQL lub notesie:
GRANT CREATE SCHEMA ON my-catalog TO `data-consumers`;
Jeśli obszar roboczy został automatycznie włączony dla Unity Catalog, administrator obszaru roboczego jest właścicielem katalogu obszarów roboczych i może przyznać uprawnienia do tworzenia nowych schematów.
GRANT CREATE SCHEMA ON <workspace-catalog> TO `data-consumers`;
Możesz również przyznać i odwołać uprawnienia przy użyciu Eksploratora wykazu.
Important
Nie można udzielić uprawnień grupom users lub admins, które są lokalne dla obszaru roboczego. Aby przyznać uprawnienia do grup, muszą być grupami na poziomie konta.
Aby uzyskać szczegółowe informacje na temat zarządzania uprawnieniami w katalogu Unity, zobacz Zarządzanie uprawnieniami w katalogu Unity.
Krok 5. Tworzenie nowych katalogów i schematów
Aby rozpocząć korzystanie z Unity Catalogu, musisz mieć zdefiniowany co najmniej jeden katalog. Katalogi są podstawową jednostką izolacji danych i organizacji w Unity Catalogu. Wszystkie schematy i tabele działają w wykazach, podobnie jak woluminy, widoki i modele.
Niektóre obszary robocze nie mają automatycznie przydzielonego katalogu. Aby korzystać z Unity Catalog, administrator obszaru roboczego musi utworzyć pierwszy katalog dla takiego obszaru roboczego.
Inne obszary robocze mają dostęp do wstępnie przygotowanego katalogu, do którego użytkownicy mogą uzyskać dostęp (katalogu obszaru roboczego lub katalogu main, w zależności od tego, jak obszar roboczy został włączony dla Unity Catalog). W miarę dodawania większej ilości danych i zasobów sztucznej inteligencji do usługi Azure Databricks można utworzyć dodatkowe wykazy w celu grupowania tych zasobów w sposób ułatwiający logiczne zarządzanie danymi.
Aby uzyskać zalecenia dotyczące najlepszego sposobu używania katalogów i schematów do organizowania danych i zasobów sztucznej inteligencji, zobacz Najlepsze praktyki dotyczące katalogu Unity.
Jako administrator magazynu metadanych, administrator obszaru roboczego (tylko obszary robocze z włączoną automatyczną obsługą) lub inny użytkownik z uprawnieniami CREATE CATALOG możesz utworzyć nowe wykazy w magazynie metadanych. Gdy to zrobisz, powinieneś/powinnaś:
Utwórz magazyn zarządzany dla nowego katalogu.
Magazyn zarządzany to dedykowana lokalizacja magazynu na koncie platformy Azure dla zarządzanych tabel i woluminów zarządzanych. Magazyn zarządzany można przypisać do magazynu metadanych, do katalogów i do schematów. Gdy użytkownik tworzy tabelę, dane są przechowywane w lokalizacji przechowywania, która jest najniższa w hierarchii. Jeśli na przykład lokalizacja magazynu jest zdefiniowana dla magazynu metadanych i wykazu, ale nie schematu, dane są przechowywane w lokalizacji zdefiniowanej dla wykazu.
Databricks zaleca przypisanie magazynu zarządzanego na poziomie katalogu, ponieważ katalogi zwykle reprezentują logiczne jednostki izolacji danych. Jeśli dane w wielu katalogach współużytkują tę samą lokalizację magazynu, możesz domyślnie ustawić lokalizację magazynu na poziomie magazynu metadanych. Jeśli obszar roboczy został automatycznie włączony dla Unity Catalog, domyślnie nie ma przechowywania na poziomie metastore. Administrator konta ma możliwość skonfigurowania magazynu na poziomie meta-store. Zobacz Określanie lokalizacji zarządzanego magazynu w katalogu Unity i Dodawanie zarządzanego magazynu do istniejącego magazynu metadanych.
Przypisywanie magazynu zarządzanego do katalogu wymaga utworzenia:
- Poświadczenie przechowywania.
- Lokalizacja zewnętrzna odwołująca się do tych poświadczeń magazynowych.
Aby zapoznać się z wprowadzeniem do tych obiektów i instrukcjami dotyczącymi ich tworzenia, zobacz Połączenie z magazynem obiektów w chmurze przy użyciu Unity Catalog.
Powiąż nowy katalog z obszarem roboczym, jeśli chcesz ograniczyć dostęp z innych obszarów roboczych, które współużytkują ten sam magazyn metadanych.
Zobacz Ograniczanie dostępu katalogu do określonych obszarów roboczych.
Udziel uprawnień na katalogu.
Aby uzyskać szczegółowe instrukcje, zobacz Create catalogs.
Przykład tworzenia wykazu
W poniższym przykładzie pokazano tworzenie wykazu z magazynem zarządzanym, a następnie przyznanie uprawnień SELECT w wykazie:
CREATE CATALOG IF NOT EXISTS mycatalog
MANAGED LOCATION 'abfss://mycontainer@<myaccount.dfs.core.windows.net//depts/finance';
GRANT SELECT ON mycatalog TO `finance-team`;
Aby uzyskać więcej przykładów, w tym instrukcje dotyczące tworzenia katalogów przy użyciu Eksploratora wykazu, zobacz Create catalogs.
Tworzenie schematu
Schematy reprezentują bardziej szczegółowe grupowania (na przykład działy lub projekty) niż wykazy. Wszystkie tabele i inne obiekty katalogu Unity Catalog są zawarte w schematach. Jako właściciel nowego katalogu możesz zechcieć utworzyć schematy w katalogu. Jednak zamiast tego możesz delegować możliwość tworzenia schematów innym użytkownikom, dając im uprawnienia CREATE SCHEMA w wykazie.
Aby uzyskać szczegółowe instrukcje, zobacz Tworzenie schematów.
(Opcjonalnie) Przypisywanie roli administratora magazynu metadanych
Jeśli obszar roboczy został automatycznie włączony dla Unity Catalog, domyślnie nie jest przypisywana żadna rola administratora metastore. Administratorzy magazynu metadanych mają pewne uprawnienia, których nie mają administratorzy obszaru roboczego.
Jeśli potrzebujesz, możesz przypisać administratora magazynu metadanych:
- Zmień własność katalogów, gdy ktoś opuści firmę.
- Zarządzaj uprawnieniami i deleguj je do skryptu inicjowania i listy dozwolonych plików jar.
- Deleguj możliwość tworzenia katalogów i innych uprawnień najwyższego poziomu do osób, które nie są administratorami przestrzeni roboczych.
- Odbieranie udostępnionych danych za pośrednictwem funkcji Delta Sharing.
- Używaj czystych pomieszczeń.
- Usuń domyślne uprawnienia administratora obszaru roboczego .
- Dodaj magazyn zarządzany do magazynu metadanych, jeśli go nie ma. Zobacz Dodawanie magazynu zarządzanego do istniejącego magazynu metadanych.
Aby uzyskać szczegółowe informacje o roli administratora magazynu metadanych i instrukcje dotyczące przypisywania jej, zobacz Przypisywanie administratora magazynu metadanych.
Zaktualizuj tabele w metastore Hive do tabel Unity Catalog
Jeśli obszar roboczy był używany, zanim został włączony dla Unity Catalog, prawdopodobnie ma on magazyn metadanych Hive zawierający dane, które chcesz nadal wykorzystywać. Databricks rekomenduje migrowanie tabel zarządzanych przez magazyn metadanych Hive do magazynu metadanych Unity Catalog.
Zobacz Uaktualnienie obszarów roboczych Azure Databricks do Unity Catalog.
(Opcjonalnie) Sfederuj katalog metadanych Hive, aby dalej z nim pracować
Jeśli obszar roboczy ma magazyn metadanych Hive zawierający dane, których chcesz nadal używać, i zdecydujesz się nie przestrzegać zalecenia dotyczącego uaktualniania wszystkich tabel zarządzanych przez magazyn metadanych Hive do magazynu metadanych Unity Catalog, możesz kontynuować pracę z danymi w magazynie metadanych Hive, federując je jako obcy katalog w Unity Catalog. Federacja magazynu metadanych Hive może być przydatnym krokiem w ścieżce migracji do katalogu Unity. Umożliwia ona migrację przyrostowa bez adaptacji kodu, a niektóre obciążenia nadal korzystają z danych zarejestrowanych w magazynie metadanych Hive, podczas gdy inne są migrowane.
(Opcjonalnie) Utwórz magazyn na poziomie metastore'a
Mimo że usługa Databricks zaleca utworzenie oddzielnej zarządzanej lokalizacji magazynu dla każdego katalogu w magazynie metadanych (i można to zrobić w przypadku schematów), możesz zamiast tego wybrać opcję utworzenia lokalizacji zarządzanej na poziomie magazynu metadanych i użyć jej jako magazynu dla wielu katalogów i schematów.
Jeśli chcesz mieć magazyn na poziomie magazynu metadanych, musisz również przypisać administratora magazynu metadanych. Zobacz (Opcjonalnie) Przypisywanie roli administratora magazynu metadanych.
Magazyn na poziomie metadanych jest wymagany tylko wtedy, gdy korzystasz z integracji produktów partnerskich Databricks, które polegają na osobistych lokalizacjach przejściowych (wycofanych z użycia).
Aby uzyskać więcej informacji na temat hierarchii zarządzanych lokalizacji magazynu, zobacz Hierarchia lokalizacji magazynu zarządzanego.
Aby dowiedzieć się, jak dodać magazyn na poziomie metastore do metastore'ów, które go nie posiadają, zobacz Dodawanie zarządzanego magazynu do istniejącego metastore.
Note
Większość obszarów roboczych, które zostały włączone dla Unity Catalog przed 9 listopada 2023 r., ma domyślnie katalog główny magazynu danych metastore.
Dalsze kroki
- Uruchom szybki samouczek, aby utworzyć pierwszą tabelę w Unity Catalog: Samouczek: Utwórz swoją pierwszą tabelę i nadaj uprawnienia
- Zapoznaj się z Katalogiem Unity: Co to jest Katalog Unity?
- Poznaj najlepsze praktyki korzystania z Katalogu Unity: najlepsze praktyki dotyczące Katalogu Unity
- Dowiedz się, jak udzielać i odwoływać uprawnienia: Zarządzanie uprawnieniami w Katalogu Unity
- Dowiedz się, jak tworzyć tabele
- Dowiedz się, jak zaktualizować obszar roboczy do katalogu Unity
- Zainstaluj interfejs wiersza polecenia usługi Databricks: co to jest interfejs wiersza polecenia usługi Databricks?