Compartilhar via


Governança de dados com o Catálogo do Unity

Esse guia mostra como gerenciar dados e acesso a objetos de IA no Azure Databricks. Para obter informações sobre a segurança do Azure Databricks, consulte o Guia de segurança. O Azure Databricks fornece administração centralizada para dados e IA com o Catálogo do Unity e o Delta Sharing.

Centralizar o controle de acesso usando o Catálogo do Unity

O Catálogo do Unity é uma solução de governança refinada para dados e IA na plataforma Databricks. Ele ajuda a simplificar a segurança e a governança de seus dados e ativos de IA, fornecendo um local central para administrar e auditar o acesso a dados e ativos de IA.

Na maioria das contas, o Catálogo do Unity é habilitado por padrão quando você cria um espaço de trabalho. Para obter detalhes, consulte Habilitação automática do Catálogo do Unity.

Para obter uma discussão sobre como usar o Catálogo do Unity com eficiência, consulte as Práticas recomendadas do Catálogo do Unity.

Acompanhar a linhagem de dados usando o Catálogo do Unity

Você pode usar o Catálogo do Unity para capturar a linhagem de dados de runtime em consultas em qualquer linguagem executadas em um cluster do Azure Databricks ou no SQL Warehouse. A linhagem é capturada até o nível da coluna e inclui notebooks, fluxos de trabalho e painéis relacionados à consulta. Para saber mais, consulteCapturar e exibir linhagem de dados com o Catálogo do Unity.

Descobrir dados usando o Catalog Explorer

O Explorador de Catálogo de Dados do Databricks fornece uma interface do usuário para explorar e gerenciar dados e ativos de IA, incluindo esquemas (bancos de dados), tabelas, volumes (dados não tabulares) e modelos de ML registrados, juntamente com permissões de ativo, proprietários de dados, locais externos e credenciais. Use a guia Insights no Catalog Explorer para exibir as consultas recentes, mais frequentes e os usuários de qualquer tabela registrada no Unity Catalog.

Compartilhar dados usando o Delta Sharing

O Compartilhamento Delta é um protocolo aberto desenvolvido pelo Databricks para compartilhamento seguro de dados e ativo de IA com outras organizações ou equipes da sua organização, independentemente das plataformas de computação usadas.

Configurar logs de auditoria

O Databricks fornece acesso aos logs de auditoria de atividades executadas por usuários do Databricks, permitindo que sua empresa monitore padrões de uso detalhados do Databricks.

O Catálogo do Unity permite acessar e consultar facilmente os dados operacionais da sua conta, incluindo logs de auditoria, uso faturável e linhagem usando as tabelas do sistema (Visualização Pública).

Configurar identidade

Toda boa história de administração de dados começa com uma solução de identidade sólida. Para saber como configurar a identidade no Azure Databricks da melhor maneira, confira Melhores práticas de identidade.

Soluções de governança de dados herdados

O Azure Databricks também fornece estes modelos de governança herdados:

  • O controle de acesso à tabela é um modelo de governança de dados herdados que permite conceder e revogar, de forma programática, o acesso a objetos gerenciados pelo metastore interno do Hive do workspace. O Databricks recomenda que você use o Unity Catalog em vez do controle de acesso à tabela. O Unity Catalog simplifica a segurança e a governança de seus dados fornecendo um local central para administrar e auditar o acesso a dados em vários workspaces em sua conta.

  • A passagem de credenciais do Azure Data Lake Storage (herdada) também é um recurso de governança de dados herdado que permite a você se autenticar automaticamente no Armazenamento do Azure por meio de clusters do Azure Databricks usando a mesma identidade do Microsoft Entra ID (antigo Azure Active Directory) que você usa para fazer logon no Azure Databricks. O Databricks recomenda que você use o Unity Catalog.