Share via


Como analisar fontes de dados do perfil de dados no Catálogo de Dados do Azure

Importante

O Catálogo de Dados do Azure será desativado em 15 de maio de 2024.

Não é mais possível criar novas contas do Catálogo de Dados do Azure.

Para obter recursos do catálogo de dados, use o serviço Microsoft Purview que oferece governança de dados unificada para todo o seu patrimônio de dados.

Se você já estiver usando o Catálogo de Dados do Azure, precisará criar um plano de migração para que sua organização mude para o Microsoft Purview até 15 de maio de 2024.

Introdução

Catálogo de Dados do Microsoft Azure é um serviço de nuvem totalmente gerenciado que atua como um sistema de registro e sistema de descoberta em fontes de dados da empresa. Em outras palavras, o Catálogo de Dados do Azure ajuda as pessoas a descobrir, entender e usar fontes de dados, ajudando as empresas a obter mais valor de seus dados existentes. Quando uma fonte de dados é registrada no Catálogo de Dados do Azure, seus metadados são copiados e indexados pelo serviço, mas a história não para por aí.

O recurso Criação do Perfil de Dados do Catálogo de Dados do Azure examina os dados nas fontes de dados com suporte no catálogo e coleta estatísticas e informações sobre esses dados. É fácil incluir um perfil de seus ativos de dados. Ao registrar um ativo de dados, escolha Incluir Perfil de Dados na ferramenta de registro de fonte de dados.

O que é a criação de perfil de dados?

A criação de perfil de dados examina os dados na fonte de dados que está sendo registrada e coleta estatísticas e informações sobre esses dados. Durante a descoberta de fonte de dados, as estatísticas podem ajudar você a determinar a adequação dos dados para resolver seu problema de negócios.

As seguintes fontes de dados dão suporte à criação de perfil de dados:

  • Tabelas e exibições do SQL Server (incluindo o Azure SQL DB e o Azure Synapse Analytics)
  • Tabelas e exibições do oracle
  • Tabelas e exibições do Teradata
  • Tabelas do Hive

A inclusão de perfis de dados ao registrar ativos de dados ajuda os usuários a responder a perguntas sobre fontes de dados, incluindo:

  • Ele pode ser usado para resolver meu problema de negócios?
  • Os dados estão em conformidade com padrões específicos?
  • Quais são algumas das anomalias da fonte de dados?
  • Quais são os possíveis desafios de integração desses dados a meu aplicativo?

Observação

Você também pode adicionar documentação a um ativo para descrever como os dados podem ser integrados a um aplicativo. Confira Como documentar fontes de dados.

Como incluir um perfil de dados ao registrar uma fonte de dados

É fácil incluir um perfil de sua fonte de dados. Quando você registra uma fonte de dados, no painel Objetos a ser registrados da ferramenta de registro da fonte de dados, escolha Incluir Perfil dos Dados.

A caixa Incluir Perfil de Dados é marcada na parte inferior da janela Objetos a serem registrados.

Para saber mais sobre como registrar as fontes de dados, consulte Como registrar as fontes de dados e Introdução ao Catálogo de Dados do Azure.

Filtragem de ativos de dados que incluem perfis de dados

Para descobrir ativos de dados que incluem um perfil de dados, você pode incluir has:tableDataProfilesou has:columnsDataProfilescomo um dos seus termos de pesquisa.

Observação

A seleção de Incluir Dados de Perfil na ferramenta de registro de fonte de dados inclui informações de perfil de nível de coluna e da tabela. No entanto, a API de Catálogo de Dados permite que os ativos de dados sejam registrados com um único conjunto de informações de perfil incluído.

Exibição de informações de perfil de dados

Depois de encontrar uma fonte de dados adequada com um perfil, você pode exibir os detalhes do perfil de dados. Para exibir o perfil de dados, selecione um ativo de dados e escolha Perfil de Dados na janela do portal do Catálogo de Dados.

A guia do perfil de dados é selecionada na parte superior da página, entre colunas e documentação.

Um perfil de dados no Catálogo de Dados do Azure mostra informações de perfil de tabela e coluna, incluindo:

Perfil de dados de objeto

  • Número de linhas
  • Tamanho de tabela
  • Quando o objeto foi atualizado pela última vez

Perfil de dados de coluna

  • Tipo de dados da coluna
  • Número de valores distintos
  • Número de linhas com valores NULL
  • Desvio mínimo, máximo, médio e padrão para valores de colunas

Resumo

A criação de perfil de dados fornece estatísticas e informações sobre ativos de dados registrados para ajudar você a determinar a adequação dos dados para solucionar problemas de negócios. Além de anotar e documentar fontes de dados, os perfis de dados podem dar aos usuários uma compreensão mais profunda dos dados.

Confira também