Compartilhar via


Catálogo de dados

Um catálogo de dados registra e mantém informações de dados em um local centralizado para que ele esteja disponível para sua organização. Ele minimiza a chance de equipes de projeto diferentes ingerirem dados redundantes, o que impede produtos de dados duplicados. Recomendamos que você crie um serviço de catálogo de dados para definir os metadados de produtos de dados armazenados entre zonas de destino de dados.

A análise em escala de nuvem depende do Microsoft Purview para registrar fontes de dados empresariais, classificá-las, garantir a qualidade dos dados e fornecer acesso de autoatendimento altamente seguro.

O Microsoft Purview é um serviço baseado em locatário que pode se comunicar com cada zona de destino de dados. Ele cria uma rede virtual gerenciada e a implanta na região da zona de destino de dados. Você pode implantar runtimes de integração (IR) de rede virtual gerenciadas do Azure nestas redes virtuais gerenciadas em qualquer região disponível do Microsoft Purview. O IR da rede virtual gerenciada pode usar pontos de extremidade privados para se conectar com segurança e verificar as fontes de dados com suporte. Essa abordagem ajuda a isolar e proteger o processo de integração de dados. Para obter mais informações, consulte Usar redes virtuais gerenciadas com sua conta do Microsoft Purview.

Se você usar o Azure Databricks, recomendamos usar o Azure Databricks Unity Catalog além do Microsoft Purview. O Catálogo do Unity fornece recursos centralizados de controle de acesso, auditoria, linhagem de dados e descoberta de dados nos workspaces do Databricks. Para obter mais informações, consulte Melhores práticas do Catálogo do Unity.

Observação

Este artigo se concentra no uso do Microsoft Purview para governança, mas sua empresa pode ter investimentos em outros produtos, como Alation, Okera ou Collibra. Essas soluções são baseadas em assinatura. Recomendamos que você os implante na zona de destino de gerenciamento de dados. Eles podem exigir integração personalizada.

Descoberta de dados

A descoberta de dados reflete o estado de todos os dados da empresa. Eles compõem a propriedade de dados. Durante a descoberta, a propriedade de dados é verificada e classificada. O processo de exame conecta-se diretamente à fonte de dados de acordo com um agendamento definido.

À medida que você adiciona uma nova zona de destino de dados ao ambiente, os data lakes e as fontes de persistência poliglota associados devem ser registrados como fontes para os rastreadores do catálogo de dados examinarem.

Com a descoberta automatizada da propriedade de dados para preencher o catálogo, é possível:

  • Rastrear metadados de fontes de dados locais e do Azure
  • Examinar seus data lakes, blobs e outros destinos compatíveis
  • Extrair o esquema dos destinos de dados para tipos de arquivo XML, TSV, CSV, PSV, SSV, JSON, Parquet, Avro e ORC
  • Permitir atualizações automatizadas do catálogo por meio do agendamento configurável de exames e conjuntos de regras de exame

Importante

Ao adicionar uma nova zona de destino de dados ao ambiente, registre os data lakes associados e o armazenamento poliglota por meio do Azure DevOps como uma fonte para os rastreadores do catálogo de dados verificarem, controlarem e gerenciarem a integridade dos dados.

Classificação de dados

O Microsoft Purview permite que você aplique classificações de dados do sistema ou personalizadas em ativos de arquivo, tabela ou coluna.

As classificações de dados são como marcas de assunto. O Microsoft Purview marca e identifica o conteúdo de tipos de dados específicos encontrados em seu patrimônio de dados durante a verificação. Você usa rótulos de confidencialidade para identificar as categorias de tipos de classificação em seus dados organizacionais. Também é possível usar rótulos de confidencialidade para agrupar as políticas que serão aplicadas a cada categoria. O Microsoft Purview usa os mesmos tipos de informações confidenciais que o Microsoft 365, permitindo que você estenda suas políticas e proteções de segurança existentes em todo o seu conteúdo e patrimônio de dados.

O Microsoft Purview pode examinar e classificar documentos automaticamente. Por exemplo, se você tiver um arquivo chamado multiple.docx e ele tiver um número de ID nacional em seu conteúdo, o Microsoft Purview adiciona uma classificação, por exemplo, EU National Identification Number à página de detalhes do ativo.

O Microsoft Defender para SQL é um recurso disponível para o Banco de Dados SQL do Azure e para a Instância Gerenciada de SQL do Azure. Ele inclui a funcionalidade para descobrir e classificar dados confidenciais, identificando e atenuante banco de dados vulnerabilidades potenciais e detectar atividades anormais que podem indicar uma ameaça para seu banco de dados. O Microsoft Defender para SQL fornece um local centralizado para habilitar e gerenciar esses recursos.

Próximas etapas