Een beheerde opslaglocatie opgeven in Unity Catalog
Een beheerde opslaglocatie geeft een locatie op in de opslag van cloudobjecten voor het opslaan van gegevens voor beheerde tabellen en beheerde volumes.
U kunt een beheerde opslaglocatie koppelen aan een metastore, catalogus of schema. Beheerde opslaglocaties op lagere niveaus in de hiƫrarchie overschrijven opslaglocaties die zijn gedefinieerd op hogere niveaus wanneer beheerde tabellen of beheerde volumes worden gemaakt.
Beheerde opslag op metastoreniveau is optioneel en nieuwe werkruimten die zijn ingeschakeld voor Unity Catalog, worden automatisch gemaakt zonder een beheerde opslaglocatie op metastoreniveau. Azure Databricks raadt u aan beheerde opslag toe te wijzen op catalogusniveau voor logische gegevensisolatie, met metastore-niveau en schemaniveau als opties. Opslag op metastoreniveau is echter vereist voor bepaalde functionaliteit, zoals het delen van notebooks met Delta Sharing of het gebruik van persoonlijke faseringslocaties als Een Azure Databricks-partner. Zie De bouwstenen voor automatisch inschakelen van Unity Catalog, Gegevensbeheer en gegevensisolatie en een Unity Catalog-metastore maken.
Wat is een beheerde opslaglocatie?
Beheerde opslaglocaties hebben de volgende eigenschappen:
- Met beheerde tabellen en beheerde volumes worden gegevens- en metagegevensbestanden opgeslagen op beheerde opslaglocaties.
- Beheerde opslaglocaties mogen niet overlappen met externe tabellen of externe volumes.
In de volgende tabel wordt beschreven hoe een beheerde opslaglocatie wordt gedeclareerd en gekoppeld aan Unity Catalog-objecten:
Gekoppeld Unity Catalog-object | Instellen | Relatie tot externe locaties |
---|---|---|
Metastore | Geconfigureerd door accountbeheerder tijdens het maken van de metastore. | Kan een externe locatie niet overlappen. |
Catalogus | Opgegeven tijdens het maken van de catalogus met behulp van het MANAGED LOCATION trefwoord. |
Moet zich in een externe locatie bevinden. |
Schema | Opgegeven tijdens het maken van het schema met behulp van het MANAGED LOCATION trefwoord. |
Moet zich in een externe locatie bevinden. |
De beheerde opslaglocatie waarin gegevens en metagegevens voor beheerde tabellen en beheerde volumes worden opgeslagen, gebruikt de volgende regels:
- Als het schema een beheerde locatie heeft, worden de gegevens opgeslagen op de door het schema beheerde locatie.
- Als het bevatde schema geen beheerde locatie heeft, maar de catalogus een beheerde locatie heeft, worden de gegevens opgeslagen in de beheerde cataloguslocatie.
- Als het met het schema of de opgegeven catalogus geen beheerde locatie heeft, worden gegevens opgeslagen op de beheerde locatie van de metastore.
Unity Catalog voorkomt overlapping van locatiebeheer. Zie Hoe werken paden voor gegevens die worden beheerd door Unity Catalog?
Beheerde opslaglocatie, hoofdmap van opslag en opslaglocatie
Wanneer u een MANAGED LOCATION
voor een catalogus of schema opgeeft, wordt de opgegeven locatie bijgehouden als de opslaghoofdmap in Unity Catalog. Om ervoor te zorgen dat alle beheerde entiteiten een unieke locatie hebben, voegt Unity Catalog gehashte submappen toe aan de opgegeven locatie met behulp van de volgende indeling:
Object | Pad |
---|---|
Schema | <storage-root>/__unitystorage/schemas/00000000-0000-0000-0000-000000000000 |
Catalogus | <storage-root>/__unitystorage/catalogs/00000000-0000-0000-0000-000000000000 |
Het volledig gekwalificeerde pad voor de beheerde opslaglocatie wordt bijgehouden als de opslaglocatie in Unity Catalog.
U kunt dezelfde beheerde opslaglocatie opgeven voor meerdere schema's en catalogi.
Vereiste bevoegdheden
Gebruikers met de CREATE MANAGED STORAGE
bevoegdheid op een externe locatie kunnen beheerde opslaglocaties configureren tijdens het maken van een catalogus of schema.
Accountbeheerders kunnen een optionele beheerde opslaglocatie toevoegen op metastoreniveau.
Een beheerde opslaglocatie instellen voor een metastore
Een beheerde opslaglocatie instellen voor een catalogus
Stel een beheerde opslaglocatie in voor een catalogus met behulp van het trefwoord tijdens het MANAGED LOCATION
maken van de catalogus, zoals in het volgende voorbeeld:
CREATE CATALOG <catalog-name>
MANAGED LOCATION 'abfss://<container-name>@<storage-account>.dfs.core.windows.net/<path>/<directory>';
U kunt Catalog Explorer ook gebruiken om de beheerde opslaglocatie voor een catalogus in te stellen. Zie Catalogussen maken.
Een beheerde opslaglocatie instellen voor een schema
Stel een beheerde opslaglocatie in voor een schema met behulp van het trefwoord tijdens het MANAGED LOCATION
maken van het schema, zoals in het volgende voorbeeld:
CREATE CATALOG <catalog>.<schema-name>
MANAGED LOCATION 'abfss://<container-name>@<storage-account>.dfs.core.windows.net/<path>/<directory>';
U kunt Catalog Explorer ook gebruiken om de beheerde opslaglocatie voor een schema in te stellen. Zie Schema's maken.
Volgende stappen
Opslaglocaties beheren worden gebruikt voor het maken van beheerde tabellen en beheerde volumes. Zie Werken met beheerde tabellen en wat zijn Unity Catalog-volumes?