Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
As ligações de origem de dados configuram a autenticação necessária para criar perfis de dados para snapshot estatísticas ou analisar os seus dados quanto a anomalias e classificação de qualidade de dados.
Configurar ligações de origem de dados é o quarto passo no ciclo de vida da qualidade de dados de um recurso de dados. Os passos anteriores são:
- Atribua permissões de administrador de qualidade de dados aos utilizadores no Catálogo unificado para utilizar todas as funcionalidades de qualidade de dados.
- Registe e analise uma origem de dados no seu Mapa de Dados do Microsoft Purview.
- Adicionar recursos de dados a um produto de dados.
Pré-requisitos
- Para criar ligações a recursos de dados, os utilizadores têm de ter a função de responsável pela qualidade dos dados.
- Precisa, pelo menos, de acesso de leitura à origem de dados para a qual está a configurar a ligação.
Origens de dados multicloud suportadas
Navegue no documento de origem de dados suportado para ver a lista de origens de dados suportadas, incluindo formatos de ficheiro para criação de perfis de dados e análise da qualidade dos dados, com e sem suporte de rede virtual.
Atualmente, as análises de qualidade de dados só podem ser executadas com a Identidade Gerida como uma opção de autenticação. Os serviços de qualidade de dados são executados no Apache Spark 3.4 e no Delta Lake 2.4.
Importante
Para aceder a estas origens, tem de definir as origens de Armazenamento do Microsoft Azure para ter uma firewall aberta, para Permitir Serviços Azure Fidedignos ou para utilizar pontos finais privados, siga a orientação documentada no guia de configuração da rede virtual gerida de qualidade de dados.
Configurar a ligação de origem de dados
Siga estes passos para criar uma nova ligação para os produtos de dados e recursos de dados num domínio de governação.
- Em Catálogo unificado, selecione Gestão de estado de funcionamento e, em seguida, selecione Qualidade dos dados.
- Selecione um domínio de governação na lista.
- Na lista pendente Gerir , selecione Ligações.
- Na página Ligações , selecione Novo.
- No painel Criar lista de opções de ligação , introduza um Nome a apresentar e uma Descrição opcional.
- Selecione um Tipo de origem.
- Selecione uma das origens de dados: Azure subscrição, Mapa de Dados ou introduza uma origem de dados manualmente. Consoante a origem de dados que escolher, introduza os detalhes de acesso necessários. Em seguida, a ligação é testada.
- Se a ligação de teste for bem-sucedida, selecione Submeter para concluir a configuração da ligação.
Dica
- Também pode criar uma ligação aos seus recursos com pontos finais privados e uma rede virtual gerida Qualidade de Dados do Microsoft Purview. Saiba mais sobre como configurar redes virtuais geridas para a qualidade dos dados.
- Os passos de configuração da ligação variam consoante os conectores nativos. Veja os passos de configuração da ligação dos artigos de conectores nativos para configurar a ligação para conectores Azure Databricks, Snowflake, Google BigQuery e Azure Synapse.
- Para configurar Azure ligação do Conjunto de SQL Dedicado (anteriormente SQL DW), os utilizadores têm de selecionar o tipo de origem como SQL do Azure base de dados e adicionar
sqldatawarehouse.database.windows.netcomo nome de ponto final. - A região da rede virtual é preenchida automaticamente a partir da região de origem selecionada. Encontre detalhes sobre a gestão do aprovisionamento de rede virtual.
- Para Instância Gerenciada de SQL, tem de indicar o número da porta para a ligação. O número da porta de ponto final público é 3342 e o número da porta de ponto final privado é 1433.
Conceder permissões ao Microsoft Purview na origem
Depois de criar a ligação, tem de conceder permissões de identidade gerida do Microsoft Purview nas suas origens de dados para as analisar:
Para analisar Azure Data Lake Storage Gen2, atribua a função de leitor de dados do blob de armazenamento à Identidade Gerida do Microsoft Purview. Siga os passos para atribuir permissões de identidade gerida.
Para analisar uma base de dados SQL do Azure, atribua a função db_datareader à Identidade Gerida do Microsoft Purview. Siga os passos para atribuir permissões de identidade gerida.
Conteúdo relacionado
- Qualidade de dados para o patrimônio de dados do Fabric
- Qualidade dos dados das origens de dados espelhadas dos Recursos de Infraestrutura
- Qualidade de dados para fontes de dados de atalho do Fabric
- Qualidade dos dados para Azure Synapse armazéns de dados e sem servidor
- Qualidade de dados para Catálogo Azure Databricks Unity
- Qualidade dos dados para origens de dados do Snowflake
- Qualidade dos dados do Google BigQuery
- Suporte nativo de qualidade de dados para dados iceberg
Próximas etapas
- Configure e execute a criação de perfis de dados para um recurso na sua origem de dados.
- Configure regras de qualidade de dados com base nos resultados da criação de perfis e aplique-as ao recurso de dados.
- Configure e execute uma análise de qualidade de dados num produto de dados para avaliar a qualidade de todos os recursos suportados no produto de dados.
- Reveja os resultados da análise para avaliar a qualidade atual dos dados do produto de dados.