Spécifier un emplacement de stockage managé dans Unity Catalog

Un emplacement de stockage managé spécifie un emplacement dans le stockage d’objets cloud pour stocker des données pour les tables managées et les volumes managés.

Vous pouvez associer un emplacement de stockage managé à un metastore, un catalogue ou un schéma. Les emplacements de stockage managés à des niveaux inférieurs dans la hiérarchie remplacent les emplacements de stockage définis à des niveaux supérieurs lorsque des tables managées ou des volumes managés sont créés.

Lorsqu’un administrateur de compte crée un metastore, il peut associer un emplacement de stockage dans un conteneur Azure Data Lake Storage Gen2 ou un compartiment Cloudflare R2 dans votre compte de fournisseur de cloud à utiliser comme emplacement de stockage managé. Les emplacements de stockage managés au niveau du catalogue et du schéma sont facultatifs, mais Databricks recommande d’attribuer des emplacements de stockage managés au niveau du catalogue pour l’isolement logique des données. Consultez Blocs de construction de la gouvernance des données et de l’isolement des données.

Important

Si votre espace de travail a été activé automatiquement pour Unity Catalog, le metastore Unity Catalog a été créé sans emplacement de stockage managé au niveau du metastore. Vous devez attribuer un emplacement de stockage managé au niveau du catalogue ou du schéma. Consultez Activation automatique de Unity Catalog et Blocs de construction de la gouvernance des données et de l’isolement des données.

Qu’est-ce qu’un emplacement de stockage managé ?

Les emplacements de stockage managés ont les propriétés suivantes :

  • Les tables managées et les volumes managés stockent les fichiers de données et de métadonnées dans les emplacements de stockage managés.
  • Les emplacements de stockage managés ne peuvent pas chevaucher des tables externes ou des volumes externes.

Le tableau suivant décrit comment un emplacement de stockage managé est déclaré et associé à des objets Unity Catalog :

Objet Unity Catalog associé Définition Relation avec les emplacements externes
Metastore Configuré par l’administrateur de compte lors de la création du metastore. Impossible de chevaucher un emplacement externe.
Catalogue Spécifié lors de la création du catalogue avec le mot clé MANAGED LOCATION. Doit être contenu dans un emplacement externe.
schéma Spécifié lors de la création du schéma avec le mot clé MANAGED LOCATION. Doit être contenu dans un emplacement externe.

L’emplacement de stockage managé utilisé pour stocker les données et les métadonnées des tables managées et des volumes managés utilise les règles suivantes :

  • Si le schéma contenant a un emplacement managé, les données sont stockées dans l’emplacement managé par le schéma.
  • Si le schéma contenant n’a pas d’emplacement managé, mais que le catalogue a un emplacement managé, les données sont stockées dans l’emplacement managé par le catalogue.
  • Si ni le schéma conteneur ni le catalogue conteneur n’ont d’emplacement managé, les données sont stockées dans l’emplacement managé du metastore.

Unity Catalog empêche le chevauchement de la gouvernance des emplacements. Consultez Comment fonctionnent les chemins pour les données gérées par Unity Catalog ?.

Emplacement de stockage managé, racine de stockage et emplacement de stockage

Lorsque vous spécifiez un MANAGED LOCATION pour un catalogue ou un schéma, l’emplacement fourni est suivi comme racine de stockage dans Unity Catalog. Pour vous assurer que toutes les entités managées ont un emplacement unique, Unity Catalog ajoute des sous-répertoires hachés à l’emplacement spécifié, au format suivant :

Object Chemin d’accès
schéma <storage-root>/__unitystorage/schemas/00000000-0000-0000-0000-000000000000
Catalogue <storage-root>/__unitystorage/catalogs/00000000-0000-0000-0000-000000000000

Le chemin d’accès complet de l’emplacement de stockage managé est suivi comme emplacement de stockage dans Unity Catalog.

Vous pouvez spécifier le même emplacement de stockage managé pour plusieurs schémas et catalogues.

Privilèges requis

Les utilisateurs disposant du privilège CREATE MANAGED STORAGE sur un emplacement externe peuvent configurer des emplacements de stockage managés lors de la création du catalogue ou du schéma.

Les emplacements de stockage managés définis au niveau du metastore doivent être configurés par les administrateurs de compte lors de la création du metastore.

Définir un emplacement de stockage managé pour un catalogue

Définissez un emplacement de stockage managé pour un catalogue à l’aide du mot clé MANAGED LOCATION lors de la création du catalogue, comme dans l’exemple suivant :

CREATE CATALOG <catalog-name>
MANAGED LOCATION 'abfss://<container-name>@<storage-account>.dfs.core.windows.net/<path>/<directory>';

Définir un emplacement de stockage managé pour un schéma

Définissez un emplacement de stockage managé pour un schéma à l’aide du mot clé MANAGED LOCATION lors de la création du schéma, comme dans l’exemple suivant :

CREATE CATALOG <catalog>.<schema-name>
MANAGED LOCATION 'abfss://<container-name>@<storage-account>.dfs.core.windows.net/<path>/<directory>';

Étapes suivantes

Les emplacements de stockage managés sont utilisés pour créer des tables managées et des volumes managés. Consultez Créer des tables dans Unity Catalog et Créer et utiliser des volumes.