Condividi tramite


Che cosa sono gli schemi in Azure Databricks?

In Unity Catalog uno schema è figlio di un catalogo e può contenere tabelle, viste, volumi, modelli e funzioni. Gli schemi offrono categorie più granulari dell'organizzazione dei dati rispetto ai cataloghi.

Questo articolo descrive il ruolo degli schemi nella gerarchia degli oggetti dati di Azure Databricks in Unity Catalog.

Per informazioni sugli schemi nel metastore Hive locale dell'area di lavoro legacy, vedere Oggetti di database nel metastore Hive legacy.

Che cos'è uno schema?

In Unity Catalog uno schema è il secondo livello dello spazio dei nomi a tre livelli di Unity Catalog (catalog.schema.table-etc).

Diagramma del modello a oggetti del catalogo Unity, incentrato sullo schema

Uno schema organizza i dati e gli asset di intelligenza artificiale in categorie logiche più granulari rispetto ai cataloghi. In genere uno schema rappresenta un singolo caso d'uso, un progetto o una sandbox del team. Indipendentemente dal tipo di categoria, gli schemi sono uno strumento utile per gestire il controllo di accesso ai dati e migliorare l'individuabilità dei dati.

Nota

In Azure Databricks gli schemi vengono talvolta chiamati database. Ad esempio, CREATE DATABASE è un alias per CREATE SCHEMA. Questa terminologia è diversa da quella di alcuni sistemi di database relazionali in cui un database è una raccolta di schemi.

Per altre informazioni sulla gerarchia degli oggetti dati in Unity Catalog, vedere Che cosa sono gli oggetti di database in Azure Databricks?.

Percorsi gestiti per gli schemi

In Unity Catalog è possibile isolare fisicamente i dati per tutte le tabelle gestite e i volumi gestiti in uno schema da quello di altri schemi in un catalogo specificando un percorso di archiviazione gestito per lo schema. Questo è completamente facoltativo. Se non si specifica un percorso di archiviazione gestito per lo schema, i dati si trovano nel percorso di archiviazione gestito del catalogo e, se non è definito alcun oggetto per il catalogo, si trova nel percorso di archiviazione gestito del metastore. Vedere Specificare un percorso di archiviazione gestito nel catalogo unity.

L'isolamento dei dati per tabelle e volumi esterni dipende dalla modalità di gestione dei dati nell'archiviazione cloud. È indipendente dalla posizione gestita dello schema.

Passaggi successivi