Governança de dados com o Catálogo do Unity
Esse guia mostra como gerenciar dados e acesso a objetos de IA no Azure Databricks. Para obter informações sobre a segurança do Azure Databricks, consulte o Guia de segurança. O Azure Databricks fornece administração centralizada para dados e IA com o Catálogo do Unity e o Delta Sharing.
Centralizar o controle de acesso usando o Catálogo do Unity
O Catálogo do Unity é uma solução de governança refinada para dados e IA na plataforma Databricks. Ele ajuda a simplificar a segurança e a governança de seus dados e ativos de IA, fornecendo um local central para administrar e auditar o acesso a dados e ativos de IA.
Na maioria das contas, o Catálogo do Unity é habilitado por padrão quando você cria um espaço de trabalho. Para obter detalhes, consulte Habilitação automática do Catálogo do Unity.
Para obter uma discussão sobre como usar o Catálogo do Unity com eficiência, consulte as Práticas recomendadas do Catálogo do Unity.
Acompanhar a linhagem de dados usando o Catálogo do Unity
Você pode usar o Catálogo do Unity para capturar a linhagem de dados de runtime em consultas em qualquer linguagem executadas em um cluster do Azure Databricks ou no SQL Warehouse. A linhagem é capturada até o nível de coluna e inclui notebooks, trabalhos e painéis de controle relacionados à consulta. Para saber mais, consulteCapturar e exibir linhagem de dados com o Catálogo do Unity.
Descobrir dados usando o Catalog Explorer
O Explorador de Catálogo de Dados do Databricks fornece uma interface do usuário para explorar e gerenciar dados e ativos de IA, incluindo esquemas (bancos de dados), tabelas, volumes (dados não tabulares) e modelos de ML registrados, juntamente com permissões de ativo, proprietários de dados, locais externos e credenciais. Use a guia Insights no Catalog Explorer para exibir as consultas recentes, mais frequentes e os usuários de qualquer tabela registrada no Unity Catalog.
Compartilhar dados usando o Delta Sharing
O Compartilhamento Delta é um protocolo aberto desenvolvido pelo Databricks para compartilhamento seguro de dados e ativo de IA com outras organizações ou equipes da sua organização, independentemente das plataformas de computação usadas.
Configurar logs de auditoria
O Databricks fornece acesso aos logs de auditoria de atividades executadas por usuários do Databricks, permitindo que sua empresa monitore padrões de uso detalhados do Databricks.
O Catálogo do Unity permite acessar e consultar facilmente os dados operacionais da sua conta, incluindo logs de auditoria, uso faturável e linhagem usando as tabelas do sistema (Visualização Pública).
Configurar identidade
Toda boa história de administração de dados começa com uma solução de identidade sólida. Para saber como configurar a identidade no Azure Databricks da melhor maneira, confira Melhores práticas de identidade.
Soluções de governança de dados herdados
O Azure Databricks também fornece estes modelos de governança herdados:
O controle de acesso à tabela é um modelo de governança de dados herdados que permite conceder e revogar, de forma programática, o acesso a objetos gerenciados pelo metastore interno do Hive do workspace. O Databricks recomenda que você use o Unity Catalog em vez do controle de acesso à tabela. O Unity Catalog simplifica a segurança e a governança de seus dados fornecendo um local central para administrar e auditar o acesso a dados em vários workspaces em sua conta.
A passagem de credencial do Azure Data Lake Storage (herdado) também é um recurso de governança de dados herdado que permite que você se autentique automaticamente no Armazenamento do Microsoft Azure a partir de clusters do Azure Databricks, usando a mesma identidade do Microsoft Entra ID que você usa para fazer login no Azure Databricks. O Databricks recomenda que você use o Unity Catalog.