Einrichten und Verwalten des Unity Catalog

In diesem Artikel wird erläutert, wie Sie Unity Catalog zum Verwalten von Daten in Ihrem Azure Databricks-Arbeitsbereich konfigurieren und verwenden. Es ist in erster Linie für Administratoren des Arbeitsbereichs vorgesehen, die Unity Catalog zum ersten Mal verwenden.

Am Ende dieses Artikels haben Sie Folgendes:

  • Ein Arbeitsbereich, der für Unity Catalog aktiviert ist.
  • Compute, der Zugriff auf den Unity Catalog hat.
  • Benutzer mit der Berechtigung, auf Objekte im Unity Catalog zuzugreifen und sie zu erstellen.

Vielleicht möchten Sie auch andere einführende Artikel lesen:

Hinweis

Wenn Sie einen vorhandenen Arbeitsbereich ohne Unity Catalog auf Unity Catalog aktualisieren möchten, können Sie von der Verwendung UCX, einem Databricks Labs-Projekt profitieren, das eine Reihe von Workflows und Hilfsprogrammen zum Aktualisieren von Identitäten, Berechtigungen und Tabellen zum Unity Catalog bereitstellt. Siehe Verwenden der UCX-Hilfsprogramme zum Upgrade Ihres Arbeitsbereichs auf Unity Catalog.

Übersicht über die Aktivierung des Unity Catalog

Um Unity Catalog zu verwenden, müssen Ihre Azure Databricks-Arbeitsbereiche für Unity Catalog aktiviert sein. Dies bedeutet, dass die Arbeitsbereiche an einen Unity-Catalog-Metastore, den Container der obersten Ebene für Unity-Catalog-Metadaten, angefügt sind.

Die Art und Weise, wie Administratoren Unity Catalog einrichten, hängt davon ab, ob der Arbeitsbereich automatisch für Unity Catalog aktiviert wurde oder eine manuelle Aktivierung erforderlich ist.

Automatische Aktivierung des Unity Catalog

Databricks begann am 9. November 2023, automatisch neue Arbeitsbereiche für Unity Catalog zu aktivieren, wobei ein Rollout schrittweise über Konten hinweg fortgesetzt wird. Arbeitsbereiche, die aktiviert wurden, weisen automatisch die folgenden Eigenschaften auf:

  • Ein automatisch bereitgestellter Unity-Katalog-Metastore (es sei denn, ein Unity-Katalog-Metastore ist bereits für die Arbeitsbereichsregion vorhanden).

  • Standardberechtigungen für Arbeitsbereichsadministratoren, z. B. die Möglichkeit zum Erstellen eines Katalogs oder einer externen Datenbankverbindung.

  • Kein Metastore-Administrator (es sei denn, ein vorhandener Unity-Katalog-Metastore wurde verwendet und ein Metastore-Administrator wurde bereits zugewiesen).

  • Kein Speicher auf Metastore-Ebene für verwaltete Tabellen und verwaltete Datenträger (es sei denn, ein vorhandener Unity-Catalog-Metastore mit Speicher auf Metastore-Ebene wurde verwendet).

  • Ein Arbeitsbereichskatalog, der nach der ursprünglichen Bereitstellung nach Ihrem Arbeitsbereich benannt ist.

    Alle Benutzer in Ihrem Arbeitsbereich können Objekte im default-Schema in diesem Katalog erstellen. Standardmäßig ist dieser Katalog an Ihren Arbeitsbereich gebunden, d. h. Sie können nur über Ihren Arbeitsbereich darauf zugreifen. Die automatische Bereitstellung des Arbeitsbereichskatalogs bei der Erstellung von Arbeitsbereichen wird nach und nach in den Konten eingeführt.

Diese Standardkonfigurationen funktionieren für die meisten Arbeitsbereiche gut, können aber alle von einem Arbeitsbereichsadministrator oder Kontoadministrator geändert werden. Beispielsweise kann ein Kontoadministrator einen Metastore-Administrator zuweisen und den Speicher auf Metastore-Ebene erstellen, und ein Arbeitsbereichsadministrator kann den Namen und den Zugriff auf den Arbeitsbereichskatalog ändern.

Was geschieht, wenn mein Arbeitsbereich für Unity Catalog nicht automatisch aktiviert wurde?

Wenn Ihr Arbeitsbereich für den Unity Catalog nicht automatisch aktiviert wurde, muss ein Kontoadministrator oder Metastore-Administrator den Arbeitsbereich manuell an einen Unity-Catalog-Metastore in derselben Region anfügen. Wenn kein Unity-Catalog-Metastore in der Region vorhanden ist, muss ein Kontoadministrator einen erstellen. Anweisungen finden Sie unter Erstellen eines Unity Catalog-Metastores.

Wie erkenne ich, ob mein Arbeitsbereich für Unity Catalog aktiviert wurde?

Um zu bestätigen, ob Ihr Arbeitsbereich für Unity Catalog aktiviert wurde, bitten Sie eine*n Azure Databricks-Arbeitsbereichsadministrator*in oder -Kontoadministrator*in, dies für Sie zu überprüfen. Weitere Informationen finden Sie auch unter Schritt 1: Vergewissern Sie sich, dass Ihr Arbeitsbereich für den Unity Catalog aktiviert ist.

Wie erkenne ich, ob mein Arbeitsbereich einen Arbeitsbereichskatalog enthält?

Einige neue Arbeitsbereiche weisen einen Arbeitsbereichskatalog auf, der bei der ursprünglichen Bereitstellung nach Ihrem Arbeitsbereich benannt wird. Um festzustellen, ob Ihr Arbeitsbereich einen aufweist, klicken Sie auf der Randleiste auf Katalog-SymbolKatalog, um den Katalog-Explorer zu öffnen, und suchen Sie nach einem Katalog, der Ihren Arbeitsbereichsnamen als Namen verwendet.

Hinweis

Der Arbeitsbereichskatalog gleicht allen Katalogen in Unity Catalog: ein*e Arbeitsbereichsadministrator*in kann den Namen und den Besitz ändern oder ihn sogar löschen. Unmittelbar nach dem Erstellen des Arbeitsbereichs trägt er jedoch dessen Namen.

Voraussetzungen

Bevor Sie mit den in diesem Artikel beschriebenen Aufgaben beginnen, sollten Sie sich mit den grundlegenden Konzepten von Unity Catalog vertraut machen, einschließlich Metastore, Administratorrollen und verwaltetem Speicher. Siehe Was ist Unity Catalog?.

Sie sollten auch bestätigen, dass Sie die folgenden Anforderungen erfüllen:

  • Ein Azure Databricks-Arbeitsbereich im Premium-Plan.

  • Die folgenden Rollen und Berechtigungen, die vom Status Ihres Arbeitsbereichs abhängen:

    • Arbeitsbereichsadministrator*in: Wenn Ihr Arbeitsbereich bei der Erstellung automatisch für Unity Catalog aktiviert wurde, müssen Sie ein*e Arbeitsbereichsadministrator*in sein, um die erforderlichen Aufgaben auszuführen.

    • Kontoadministrator*in: Wenn Ihr Arbeitsbereich noch nicht für Unity Catalog aktiviert ist, muss ein*e Kontoadministrator*in den Arbeitsbereich an den Metastore anfügen.

      Wenn kein Unity-Catalog-Metastore in derselben Region wie der Arbeitsbereich vorhanden ist, muss ein Kontoadministrator auch den Unity-Catalog-Metastore erstellen.

      Anweisungen zum Ermitteln, ob ein Metastore für Ihre Arbeitsbereichsregion vorhanden ist, sowie Anweisungen zum Erstellen eines Metastores finden Sie in diesem Artikel.

    Siehe Administratorrechte in Unity Catalog und automatische Aktivierung des Unity Catalog.

Schritt 1: Vergewissern Sie sich, dass Ihr Arbeitsbereich für den Unity Catalog aktiviert ist

In diesem Schritt ermitteln Sie, ob der Arbeitsbereich bereits für Unity Catalog aktiviert ist. Dabei ist „aktiviert“ so definiert, dass ein Unity Catalog-Metastore an den Arbeitsbereich angefügt ist. Wenn Ihr Arbeitsbereich nicht für Unity Catalog aktiviert ist, müssen Sie ihn manuell für Unity Catalog aktivieren. Weitere Informationen finden Sie unter Nächste Schritte, wenn Ihr Arbeitsbereich nicht für Unity Catalog aktiviert ist.

Führen Sie zum Bestätigen einen der folgenden Schritte aus.

Verwenden der Kontokonsole zum Bestätigen der Aktivierung für Unity Catalog

  1. Melden Sie sich Azure Databricks-Kontoadministrator*in bei der Kontokonsole als an.
  2. Klicken Sie auf Workspaces-SymbolArbeitsbereiche.
  3. Suchen Sie Ihren Arbeitsbereich, und überprüfen Sie die Spalte Metastore. Wenn ein Metastorename vorhanden ist, ist der Arbeitsbereich an einen Unity Catalog-Metastore angefügt und somit für Unity Catalog aktiviert.

Ausführen einer SQL-Abfrage zum Bestätigen der Aktivierung für Unity Catalog

Führen Sie die folgende SQL-Abfrage im SQL-Abfrage-Editor aus oder in einem Notebook, das an einen Cluster angefügt ist, der einen der Zugriffsmodi freigegeben oder Einzelbenutzer*in verwendet. Weitere Informationen finden Sie unter Zugriffsmodi. Es ist keine Administratorrolle erforderlich.

SELECT CURRENT_METASTORE();

Wenn die Abfrage eine Metastore-ID wie die folgende zurückgibt, ist der Arbeitsbereich an einen Unity Catalog-Metastore angefügt und somit für Unity Catalog aktiviert.

Aktuelle Metaspeicherausgabe

Nächste Schritte, wenn Ihr Arbeitsbereich nicht für Unity Catalog aktiviert ist

Wenn Ihr Arbeitsbereich nicht für Unity Catalog aktiviert (an einen Metastore angefügt) ist, hängt der nächste Schritt davon ab, ob Sie bereits einen Unity-Catalog-Metastore für Ihre Arbeitsbereichsregion definiert haben:

  • Wenn Ihr Konto bereits einen Unity-Catalog-Metastore für Ihre Arbeitsbereichsregion definiert hat, können Sie Ihren Arbeitsbereich einfach an den vorhandenen Metastore anfügen. Fahren Sie fort mit Aktivieren Ihres Arbeitsbereichs für Unity Catalog.
  • Wenn kein Unity-Catalog-Metastore für die Region Ihres Arbeitsbereichs definiert ist, müssen Sie einen Metastore erstellen und dann den Arbeitsbereich anfügen. Fahren Sie fort mit Erstellen eines Unity Catalog-Metastores.

Wenn der Arbeitsbereich für Unity Catalog aktiviert ist, fahren Sie mit dem nächsten Schritt fort.

Schritt 2: Fügen Sie Benutzer hinzu und weisen Sie die Rolle des Arbeitsbereichsadministrators zu

Der Benutzer, der den Arbeitsbereich erstellt, wird automatisch als Arbeitsbereichsbenutzer mit der Administratorrolle des Arbeitsbereichs hinzugefügt (d. a. ein Benutzer in der admins lokalen Gruppe „Arbeitsbereich“). Als Arbeitsbereichsadministrator können Sie Benutzer zum Arbeitsbereich hinzufügen und einladen, die Rolle des Arbeitsbereichsadministrators anderen Benutzern zuweisen und Dienstprinzipale und Gruppen erstellen.

Kontoadministratoren haben auch die Möglichkeit, Ihrem Arbeitsbereich Benutzer, Dienstprinzipale und Gruppen hinzuzufügen. Sie können die Rollen des Kontoadministrators und des Metastore-Administrators zuweisen.

Ausführliche Informationen finden Sie unter Verwalten von Benutzern.

Es kann praktisch sein, den Benutzerzugriff auf Azure Databricks zu verwalten, indem Sie die Provisionierung von Microsoft Entra ID (früher Azure Active Directory) einrichten. Vollständige Anweisungen finden Sie unter Synchronisieren von Benutzer*innen und Gruppen über Microsoft Entra ID.

Schritt 3: Erstellen Sie Cluster oder SQL-Warehouses, mit denen Benutzer Abfragen ausführen und Objekte erstellen können

Um Unity-Catalog-Workloads auszuführen, müssen Rechenressourcen bestimmte Sicherheitsanforderungen erfüllen. Nicht kompatible Rechenressourcen können nicht auf Daten oder andere Objekte in Unity Catalog zugreifen. SQL-Warehouses entsprechen immer den Unity Catalog-Anforderungen, aber einige Clusterzugriffsmodi sind nicht zulässig. Weitere Informationen finden Sie unter Zugriffsmodi.

Als Arbeitsbereichsadministrator können Sie die Berechnungserstellung auf Administratoren beschränken oder Benutzern das Erstellen eigener SQL-Warehouses und Cluster ermöglichen. Sie können auch Cluster-Richtlinien erstellen, die es Benutzern ermöglichen, ihre eigenen Cluster zu erstellen, und zwar unter Verwendung von Unity Catalog-konformen Spezifikationen, die Sie durchsetzen. Siehe Compute-Berechtigungen und Erstellen und Verwalten von Compute-Richtlinien.

Schritt 4: Erteilen Sie Berechtigungen für Benutzer

Um Objekte zu erstellen und auf sie in den Katalogen und Schemata von Unity Catalog zuzugreifen, muss ein Benutzer die entsprechende Berechtigung dafür haben. In diesem Abschnitt werden die Benutzer- und Administratorrechte beschrieben, die standardmäßig für einige Arbeitsbereiche gewährt werden, und es wird beschrieben, wie zusätzliche Berechtigungen gewährt werden.

Standardbenutzerrechte

Einige Arbeitsbereiche verfügen beim Start über standardmäßige Benutzerrechte (nicht Administratorrechte):

  • Wenn Ihr Arbeitsbereich mit einem automatisch bereitgestellten Arbeitsbereichskatalog gestartet wurde, können alle Arbeitsbereichsbenutzer*innen Objekte im default-Schema des Arbeitsbereichskatalogs erstellen.

    Informationen dazu, wie Sie ermitteln können, ob Ihr Arbeitsbereich über einen Arbeitsbereichskatalog verfügt, finden Sie unter Wie erkenne ich, ob mein Arbeitsbereich einen Arbeitsbereichskatalog enthält?.

  • Wenn Ihr Arbeitsbereich manuell für Unity Catalog aktiviert wurde, weist er automatisch den Katalog main als Standardkatalog auf.

    Arbeitsbereichsbenutzer*innen verfügen über die Berechtigung USE CATALOG für den Katalog main, die keine Möglichkeit zum Erstellen oder Auswählen von Objekten im Katalog bietet, aber eine Voraussetzung für die Arbeit mit Objekten im Katalog ist. Der/die Benutzer*in, der/die den Metastore erstellt hat, besitzt den Katalog main standardmäßig und kann den Besitz auf andere Benutzer*innen übertragen und diesen Zugriff gewähren.

    Wenn Metastorespeicher hinzugefügt wird, nachdem der Metastore erstellt wurde, wird kein Katalog main bereitgestellt.

Andere Arbeitsbereiche verfügen standardmäßig nicht über Kataloge, und standardmäßig sind keine Berechtigungen für Nicht-Administrator-Benutzer*innen aktiviert. Ein*e Arbeitsbereichsadministrator*in muss den ersten Katalog erstellen und Benutzer*innen Zugriff auf ihn und die darin enthaltenen Objekte gewähren. Fahren Sie mit Schritt 5: Erstellen Sie neue Kataloge und Schemas fort, bevor Sie die Schritte in diesem Abschnitt ausführen.

Standardadministratorrechte

Einige Arbeitsbereiche verfügen beim Start über standardmäßige Berechtigungen für Nicht-Administrator-Benutzer*innen:

  • Wenn Ihr Arbeitsbereich für Unity Catalog automatisch aktiviert wurde:
    • Arbeitsbereichsadministratoren können neue Kataloge und Objekte in neuen Katalogen erstellen und den Zugriff darauf gewähren.
    • Standardmäßig ist kein*e Metastore-Administrator*in vorhanden.
    • Arbeitsbereichsadministrator*innen besitzen den Arbeitsbereichskatalog (sofern vorhanden) und können Zugriff auf diesen Katalog und alle Objekte in diesem Katalog gewähren.
  • Wenn Ihr Arbeitsbereich für Unity Catalog manuell aktiviert wurde:
    • Arbeitsbereichsadministrator*innen haben standardmäßig keine besonderen Berechtigungen in Unity Catalog.
    • Metastore-Administrator*innen müssen vorhanden sein und können jedes Unity Catalog-Objekt erstellen und den Besitz eines Unity Catalog-Objekts übernehmen.

Eine Liste mit zusätzlichen Objektberechtigungen, die den Arbeitsbereichsadministratoren in automatisch aktivierten Unity-Catalog-Arbeitsbereichen gewährt werden, finden Sie unter Arbeitsbereich-Administratorberechtigungen, wenn Arbeitsbereiche automatisch für Unity Catalog aktiviert sind.

Gewähren von Berechtigungen

Für den Zugriff auf andere Objekte als die in den vorherigen Abschnitten aufgeführten muss ein*e privilegierte*r Benutzer*in diesen Zugriff gewähren.

Um beispielsweise einer Gruppe die Möglichkeit zum Erstellen neuer Schemata in my-catalog zu gewähren, kann der Katalogbesitzer Folgendes im SQL-Editor oder in einem Notebook ausführen:

GRANT CREATE SCHEMA ON my-catalog TO `data-consumers`;

Wenn Ihr Arbeitsbereich automatisch für Unity Catalog aktiviert wurde, besitzt der Arbeitsbereichsadministrator den Arbeitsbereichskatalog und kann die Möglichkeit zum Erstellen neuer Schemata gewähren:

GRANT CREATE SCHEMA ON <workspace-catalog> TO `data-consumers`;

Sie können auch Berechtigungen mithilfe des Catalog Explorers gewähren und widerrufen.

Wichtig

Sie können den lokalen Arbeitsbereichen users oder admins Gruppen keine Berechtigungen erteilen. Um Gruppen Berechtigungen zu erteilen, müssen diese Gruppen auf Kontoebene sein.

Ausführliche Informationen zum Verwalten von Berechtigungen in Unity Catalog finden Sie unter Verwalten von Berechtigungen in Unity Catalog.

Schritt 5: Erstellen Sie neue Kataloge und Schemata

Um mit der Verwendung von Unity Catalog zu beginnen, muss für Sie mindestens ein Katalog definiert sein. Kataloge sind die primäre Einheit der Datenisolation und -organisation in Unity Catalog. Alle Schemas und Tabellen befinden sich in Katalogen, ebenso wie Volumes, Sichten und Modelle.

Einige Arbeitsbereiche weisen keinen automatisch bereitgestellten Katalog auf. Um Unity Catalog zu verwenden, muss ein*e Arbeitsbereichsadministrator*in den ersten Katalog für diese Arbeitsbereiche erstellen.

Andere Arbeitsbereiche haben Zugriff auf einen vorbereiteten Katalog, auf den Ihre Benutzer*innen im Rahmen ihrer ersten Schritte zugreifen können. (Dabei handelt es sich um den Arbeitsbereichskatalog oder den Katalog main, je nachdem, wie Ihr Arbeitsbereich für Unity Catalog aktiviert wurde.) Wenn Sie weitere Daten und KI-Ressourcen zu Azure Databricks hinzufügen, können Sie zusätzliche Kataloge erstellen, um diese Objekte auf eine Weise zu gruppieren, welche die logische Verwaltung von Daten erleichtert.

Empfehlungen dazu, wie Sie Kataloge und Schemata zum Organisieren Ihrer Daten und KI-Ressourcen am besten verwenden können, finden Sie in den Bewährten Methoden des Unity Catalog.

Als Metastore-Administrator, Arbeitsbereichsadministrator (nur automatisch aktivierte Arbeitsbereiche) oder anderer Benutzer mit den CREATE CATALOG-Berechtigungen können Sie neue Kataloge im Metastore erstellen. Wenn Sie dies tun, sollten Sie Folgendes machen:

  1. Erstellen Sie einen Verwalteten Speicher für den neuen Katalog.

    Ein verwalteter Speicher ist ein dedizierter Speicherort in Ihrem Azure-Konto für verwaltete Tabellen und verwaltete Datenträger. Sie können dem Metastore, den Katalogen und den Schemata einen verwalteten Speicher zuweisen. Wenn ein Benutzer eine Tabelle erstellt, werden die Daten am untersten Speicherort in der Hierarchie gespeichert. Wenn z. B. ein Speicherort für den Metastore und den Katalog definiert ist, aber nicht für das Schema, werden die Daten an dem Speicherort gespeichert, der für den Katalog definiert ist.

    Databricks empfiehlt, dass Sie verwalteten Speicher auf Katalogebene zuweisen, da Kataloge in der Regel logische Einheiten zur Datenisolierung darstellen. Wenn Sie mit Daten in mehreren Katalogen vertraut sind, die denselben Speicherort gemeinsam nutzen, können Sie standardmäßig den Speicherort auf Metastore-Ebene verwenden. Wenn Ihr Arbeitsbereich für Unity Catalog automatisch aktiviert wurde, gibt es standardmäßig keinen Speicher auf Metastore-Ebene. Ein Kontoadministrator hat die Möglichkeit, den Speicher auf Metastore-Ebene zu konfigurieren. Weitere Informationen finden Sie unter Verwalteter Speicher und Hinzufügen von verwaltetem Speicher zu einem vorhandenen Metastore.

    Zum Zuweisen von verwaltetem Speicher zu einem Katalog müssen Sie Folgendes erstellen:

    • Speicheranmeldeinformationen.
    • Erstellen Sie einen externen Speicherort, der auf diese Speicheranmeldeinformationen verweist.

    Eine Einführung in diese Objekte und Anweisungen zum Erstellen dieser Objekte finden Sie unter Herstellen einer Verbindung mit Cloudobjektspeicher mithilfe von Unity Catalog.

  2. Binden Sie den neuen Katalog an Ihren Arbeitsbereich, wenn Sie den Zugriff von anderen Arbeitsbereichen einschränken möchten, die denselben Metastore verwenden.

    Siehe Binden eines Katalogs an einen oder mehrere Arbeitsbereiche.

  3. Erteilen Sie Berechtigungen für den Katalog.

Ausführliche Anweisungen finden Sie unter Erstellen und Verwalten von Katalogen.

Beispiel für die Katalogerstellung

Das folgende Beispiel zeigt die Erstellung eines Katalogs mit verwaltetem Speicher, gefolgt von der Erteilung der SELECT-Berechtigungen für den Katalog:

CREATE CATALOG IF NOT EXISTS mycatalog
  MANAGED LOCATION 'abfss://mycontainer@<myaccount.dfs.core.windows.net//depts/finance';

GRANT SELECT ON mycatalog TO `finance-team`;

Weitere Beispiele, einschließlich Anweisungen zum Erstellen von Katalogen mithilfe des Katalog-Explorers, finden Sie unter Erstellen und Verwalten von Katalogen.

Erstellen eines Schemas

Schemata stellen präzisere Gruppierungen (z. B. Abteilungen oder Projekte) als Kataloge dar. Alle Tabellen und andere Unity-Catalog-Objekte im Katalog sind in Schemata enthalten. Als Besitzer eines neuen Katalogs können Sie die Schemata im Katalog erstellen. Sie können aber stattdessen die Möglichkeit zum Erstellen von Schemata an andere Benutzer delegieren, indem Sie ihnen die CREATE SCHEMA Berechtigungen für den Katalog erteilen.

Ausführliche Anweisungen finden Sie unter Erstellen und Verwalten von Schemata (Datenbanken).

(Optional) Zuweisen der Metastore-Administratorrolle

Wenn Ihr Arbeitsbereich für Unity Catalog automatisch aktiviert wurde, wird standardmäßig keine Metastore-Administratorrolle zugewiesen. Metastore-Administratoren haben einige Berechtigungen, die Arbeitsbereichsadministratoren nicht haben.

Bei Bedarf können Sie einen Metastore-Administrator zuweisen:

Ausführliche Informationen zur Metastore-Administratorrolle und Anweisungen zum Zuweisen finden Sie unter Zuweisen eines Metastore-Administrators.

Aktualisieren von Tabellen in Ihrem Hive-Metastore auf Unity Catalog-Tabellen

Wenn Ihr Arbeitsbereich in Betrieb war, bevor er für Unity Catalog aktiviert wurde, verfügt er wahrscheinlich über einen Hive-Metastore, der Daten enthält, die Sie weiterhin verwenden möchten. Databricks empfiehlt, die vom Hive-Metastore verwalteten Tabellen zum Unity Catalog-Metastore zu migrieren.

Weitere Informationen finden Sie unter Upgrade von Hive-Tabellen und Sichten für Unity Catalog und Verwenden der UCX-Hilfsprogramme zum Upgrade Ihres Arbeitsbereichs auf Unity Catalog.

(Optional) Arbeiten Sie mit Ihrem Hive-Metastore weiter

Wenn Ihr Arbeitsbereich über einen Hive-Metaspeicher verfügt, der Daten enthält, die Sie weiterhin verwenden möchten, und Sie die Empfehlung nicht befolgen möchten, die Vom Hive-Metastore verwalteten Tabellen auf den Unity Catalog-Metastore zu aktualisieren, können Sie weiterhin mit Daten im Hive-Metaspeicher zusammen mit Daten im Unity Catalog-Metaspeicher arbeiten.

Der Hive-Metastore wird in Unity-Catalog-Schnittstellen als Katalog mit dem Namen hive_metastoredargestellt. Um weiterhin mit Daten in Ihrem Hive-Metastore zu arbeiten, ohne Abfragen zur Angabe des hive_metastore-Katalogs aktualisieren zu müssen, können Sie den Standardkatalog des Arbeitsbereichs auf hive_metastore einstellen. Siehe Verwalten des Standardkatalogs.

Je nachdem, wann Ihr Arbeitsbereich für den Unity Catalog aktiviert wurde, ist hive_metastoreder Standardkatalog möglicherweise bereits vorhanden.

(Optional:) Erstellen von Speicher auf Metastoreebene

Obwohl Databricks empfiehlt, einen separaten verwalteten Speicherort für jeden Katalog in Ihrem Metastore zu erstellen (und dies auch für Schemas möglich ist), können Sie stattdessen einen verwalteten Speicherort auf Metastoreebene erstellen und als Standardspeicher für mehrere Kataloge und Schemas verwenden.

Wenn Sie Speicher auf Metastoreebene wünschen, müssen Sie auch eine*n Metastore-Administrator*in zuweisen. Weitere Informationen finden Sie unter (Optional) Zuweisen der Metastore-Administratorrolle.

Speicher auf Metastoreebene ist nur dann erforderlich, wenn Folgendes zutrifft:

  • Sie möchten Notebooks per Databricks-zu-Databricks Delta Sharing freigeben.
  • Sie verwenden eine Databricks-Partnerproduktintegration, die auf persönlichen Stagingstandorten basiert (veraltet).

Weitere Informationen zur Hierarchie der verwalteten Speicherorte finden Sie unter Daten werden im Speicher physisch getrennt.

Informationen zum Hinzufügen von Speicher auf Metastoreebene zu Metastores, die bisher keinen aufweisen, finden Sie unter Hinzufügen von verwaltetem Speicher zu einem vorhandenen Metastore.

Hinweis

Die meisten Arbeitsbereiche, die vor dem 9. November 2023 für Unity Catalog aktiviert wurden, verfügen über einen Speicherstamm auf Metastoreebene.

Nächste Schritte