O que são esquemas no Azure Databricks?
No Unity Catalog, um esquema é filho de um catálogo e pode conter tabelas, exibições, volumes, modelos e funções. Os esquemas fornecem categorias mais granulares de organização de dados do que os catálogos.
Este artigo descreve a função dos esquemas na hierarquia de objetos de dados do Azure Databricks no Unity Catalog.
Para obter informações sobre esquemas no metastore do Hive local do espaço de trabalho herdado, consulte Objetos de banco de dados no metastore herdado do Hive.
O que é um esquema?
No Unity Catalog, um esquema é o segundo nível do namespace de três níveis do Unity Catalog (catalog.schema.table-etc
).
Um esquema organiza dados e ativos de IA em categorias lógicas que são mais granulares do que catálogos. Normalmente, um esquema representa um único caso de uso, projeto ou área restrita de equipe. Independentemente do tipo de categoria, os esquemas são uma ferramenta útil para gerenciar o controle de acesso a dados e melhorar a capacidade de descoberta de dados.
Nota
No Azure Databricks, os esquemas às vezes são chamados de bancos de dados. Por exemplo, CREATE DATABASE
é um alias para CREATE SCHEMA
. Essa terminologia difere de alguns sistemas de banco de dados relacionais nos quais um banco de dados é uma coleção de esquemas.
Para obter mais informações sobre a hierarquia de objetos de dados no Unity Catalog, consulte O que são objetos de banco de dados no Azure Databricks?.
Locais gerenciados para esquemas
No Unity Catalog, você pode isolar fisicamente os dados de todas as tabelas gerenciadas e volumes gerenciados em um esquema daqueles de outros esquemas em um catálogo, especificando um local de armazenamento gerenciado para o esquema. Isto é totalmente opcional. Se você não especificar um local de armazenamento gerenciado para o esquema, os dados residirão no local de armazenamento gerenciado do catálogo (e, se nenhum estiver definido para o catálogo, ele residirá no local de armazenamento gerenciado do metastore). Consulte Especificar um local de armazenamento gerenciado no Catálogo Unity.
O isolamento de dados para tabelas e volumes externos depende de como você gerencia os dados em seu armazenamento em nuvem. Ele é independente do local gerenciado do esquema.