Partilhar via


Configurar a ligação de origem de dados para a qualidade dos dados no Catálogo unificado

As ligações de origem de dados configuram a autenticação necessária para criar perfis de dados para snapshot estatísticas ou analisar os seus dados quanto a anomalias e classificação de qualidade de dados.

Configurar ligações de origem de dados é o quarto passo no ciclo de vida da qualidade de dados de um recurso de dados. Os passos anteriores são:

  1. Atribua permissões de administrador de qualidade de dados aos utilizadores no Catálogo unificado para utilizar todas as funcionalidades de qualidade de dados.
  2. Registe e analise uma origem de dados no seu Mapa de Dados do Microsoft Purview.
  3. Adicionar recursos de dados a um produto de dados.

Pré-requisitos

  1. Para criar ligações a recursos de dados, os utilizadores têm de ter a função de responsável pela qualidade dos dados.
  2. Precisa, pelo menos, de acesso de leitura à origem de dados para a qual está a configurar a ligação.

Origens de dados multicloud suportadas

Navegue no documento de origem de dados suportado para ver a lista de origens de dados suportadas, incluindo formatos de ficheiro para criação de perfis de dados e análise da qualidade dos dados, com e sem suporte de rede virtual.

Atualmente, as análises de qualidade de dados só podem ser executadas com a Identidade Gerida como uma opção de autenticação. Os serviços de qualidade de dados são executados no Apache Spark 3.4 e no Delta Lake 2.4.

Importante

Para aceder a estas origens, tem de definir as origens de Armazenamento do Microsoft Azure para ter uma firewall aberta, para Permitir Serviços Azure Fidedignos ou para utilizar pontos finais privados, siga a orientação documentada no guia de configuração da rede virtual gerida de qualidade de dados.

Configurar a ligação de origem de dados

Siga estes passos para criar uma nova ligação para os produtos de dados e recursos de dados num domínio de governação.

  1. Em Catálogo unificado, selecione Gestão de estado de funcionamento e, em seguida, selecione Qualidade dos dados.
  2. Selecione um domínio de governação na lista.
  3. Na lista pendente Gerir , selecione Ligações.
  4. Na página Ligações , selecione Novo.
  5. No painel Criar lista de opções de ligação , introduza um Nome a apresentar e uma Descrição opcional.
  6. Selecione um Tipo de origem.
  7. Selecione uma das origens de dados: Azure subscrição, Mapa de Dados ou introduza uma origem de dados manualmente. Consoante a origem de dados que escolher, introduza os detalhes de acesso necessários. Em seguida, a ligação é testada.
  8. Se a ligação de teste for bem-sucedida, selecione Submeter para concluir a configuração da ligação.

Dica

  • Também pode criar uma ligação aos seus recursos com pontos finais privados e uma rede virtual gerida Qualidade de Dados do Microsoft Purview. Saiba mais sobre como configurar redes virtuais geridas para a qualidade dos dados.
  • Os passos de configuração da ligação variam consoante os conectores nativos. Veja os passos de configuração da ligação dos artigos de conectores nativos para configurar a ligação para conectores Azure Databricks, Snowflake, Google BigQuery e Azure Synapse.
  • Para configurar Azure ligação do Conjunto de SQL Dedicado (anteriormente SQL DW), os utilizadores têm de selecionar o tipo de origem como SQL do Azure base de dados e adicionar sqldatawarehouse.database.windows.net como nome de ponto final.
  • A região da rede virtual é preenchida automaticamente a partir da região de origem selecionada. Encontre detalhes sobre a gestão do aprovisionamento de rede virtual.
  • Para Instância Gerenciada de SQL, tem de indicar o número da porta para a ligação. O número da porta de ponto final público é 3342 e o número da porta de ponto final privado é 1433.

Conceder permissões ao Microsoft Purview na origem

Depois de criar a ligação, tem de conceder permissões de identidade gerida do Microsoft Purview nas suas origens de dados para as analisar:

Próximas etapas

  1. Configure e execute a criação de perfis de dados para um recurso na sua origem de dados.
  2. Configure regras de qualidade de dados com base nos resultados da criação de perfis e aplique-as ao recurso de dados.
  3. Configure e execute uma análise de qualidade de dados num produto de dados para avaliar a qualidade de todos os recursos suportados no produto de dados.
  4. Reveja os resultados da análise para avaliar a qualidade atual dos dados do produto de dados.