Partilhar via


Projetos de Qualidade de Dados (DQS)

Aplica-se a:SQL Server

Importante

Os Serviços de Qualidade de Dados (DQS) foram removidos no SQL Server 2025 (17.x). Continuamos a oferecer suporte ao DQS no SQL Server 2022 (16.x) e em versões anteriores.

Um projeto de qualidade de dados no Data Quality Services (DQS) é um meio de usar uma base de dados de conhecimento para melhorar a qualidade dos dados de origem executando atividades de limpeza e correspondência de dados e, em seguida, exportando os dados resultantes para um banco de dados do SQL Server ou um arquivo .csv. Você pode criar um projeto de qualidade de dados como um projeto de limpeza ou um projeto correspondente para executar as respetivas atividades. Projetos de limpeza e correspondência podem ser executados usando a mesma base de conhecimento, porque o conhecimento para limpeza e correspondência de dados pode ser incorporado na mesma base de conhecimento.

Um projeto de qualidade de dados tem os seguintes benefícios:

  • Permite-lhe executar a limpeza de dados nos seus dados de origem usando o conhecimento numa base de conhecimento do DQS.

  • Permite que você execute a correspondência de dados em seus dados de origem usando a política de correspondência em uma base de dados de conhecimento.

  • Fornece um assistente para guiá-lo pelas atividades de limpeza e correspondência e exportar os dados de acordo com sua seleção para um banco de dados do SQL Server ou para um arquivo .csv. O administrador de dados pode usar o projeto de qualidade de dados para executar e controlar as etapas de limpeza assistida/interativa por computador e correspondência de dados.

Projeto de Qualidade de Dados: Atividade de Limpeza

Um projeto de melhoria da qualidade dos dados permite purificar os seus dados de origem com base em uma base de conhecimento. A atividade de limpeza de dados no DQS é um processo de duas etapas:

  1. Um processo de limpeza de dados assistido por computador que analisa os dados de origem em relação ao conhecimento na base de dados de conhecimento e propõe alterações. Os dados processados são categorizados (sugeridos, novos, inválidos, corrigidos e corretos) pelo DQS e exibidos ao usuário para processamento posterior.

  2. Um processo de limpeza interativo que permite ao administrador de dados aprovar, rejeitar ou modificar os dados propostos pelo processo de limpeza de dados assistido por computador.

Para obter informações detalhadas sobre a atividade de limpeza em um projeto de qualidade de dados, consulte Limpeza de dados.

Projeto de Qualidade de Dados: Atividade de Correspondência

Um projeto de qualidade de dados correspondente permite que você execute atividades de correspondência com base na política de correspondência em uma base de dados de conhecimento para evitar a duplicação de dados, identificando correspondências exatas e aproximadas e, assim, permitindo que você remova dados duplicados. É recomendável que você limpe seus dados antes de executar a correspondência neles. Para tal:

  1. Crie um projeto de qualidade de dados, selecione a atividade Limpeza, conclua a atividade de limpeza de dados em seus dados de origem e exporte-a para uma tabela em um banco de dados do SQL Server.

  2. Crie outro projeto de qualidade de dados usando uma base de dados de conhecimento que contenha uma política de correspondência, selecione a atividade Correspondência e, na página Mapa , selecione o banco de dados e a tabela para onde você exportou os dados limpos na etapa 1.

  3. Conclua a atividade correspondente nos dados limpos.

Para obter informações detalhadas sobre a atividade correspondente em um projeto de qualidade de dados, consulte Correspondência de dados.

Perfil de dados e notificações

Ao executar as atividades de limpeza e deduplicação em um projeto de qualidade dos dados, pode visualizar estatísticas e informações em tempo real sobre os dados que estão a ser processados pelo DQS. A perfilagem de dados ajuda a avaliar a eficácia dos processos de limpeza e correspondência, e é possível determinar até que ponto a limpeza ou a correspondência de dados melhorou a qualidade dos dados. A criação de perfil do DQS fornece duas dimensões de qualidade de dados: completude (a extensão em que os dados estão presentes) e precisão (a medida em que os dados podem ser usados para o uso pretendido). Além disso, com base nas informações de perfilagem de dados, as notificações são exibidas para o utilizador sobre as ações que podem ser realizadas para aprimorar as operações de limpeza e correspondência de dados. Para obter informações detalhadas sobre criação de perfil de dados e notificações, consulte Perfil de dados e notificações no DQS.

Descrição da Tarefa Tópico
Descreve como criar um projeto de qualidade de dados. Criar um projeto de qualidade de dados
Descreve como abrir, desbloquear, renomear e excluir um projeto de qualidade de dados. Abrir, desbloquear, renomear e excluir um projeto de qualidade de dados
Descreve como abrir um projeto do Integration Services no Data Quality Client. Projetos do Open Integration Services no Data Quality Client

Ver também

Bases de conhecimento e domínios do DQS