Conceitos do Data Quality Services
Este tópico fornece um resumo breve de conceitos do Data Quality Services (DQS) em gerenciamento de conhecimento, projetos de qualidade de dados e administração de qualidade de dados.
Neste tópico
Conceitos de gerenciamento de conhecimento
Conceitos de projeto de qualidade de dados
Conceitos de administração do Data Quality
Conceitos de gerenciamento de conhecimento
A base de dados de conhecimento do DQS é um repositório de metadados que são criados pelo administrador de dados ou pelo profissional de TI a fim de melhorar a qualidade de dados através da limpeza e da correspondência de dados. O gerenciamento de conhecimento do DQS inclui os processos usados para criar e gerenciar a base de conhecimento, de forma assistida por computador e interativamente.
Descoberta da Base de Dados de Conhecimento
A descoberta de conhecimento é um processo assistido por computador que analisa exemplos dos dados de sua organização para criar conhecimento sobre os dados. Quando você tem os resultados da análise, pode validar e aprimorar o conhecimento e, depois, aplicá-lo à execução de limpeza, correspondência e criação de perfil de dados. Para obter mais informações, consulte Bases de Dados de Conhecimento DQS e domínios.
Gerenciamento de domínio
O processo de gerenciamento de domínio lhe permite alterar ou aumentar o conhecimento gerado pelo processo de descoberta de conhecimento. Você pode editar, atualizar e revisar interativamente o conhecimento em uma base de dados de conhecimento. Uma base de dados de conhecimento consiste em domínios de dados que contêm valores de domínio e seu status, regras de domínio, relações baseadas em termos e dados de referência. No gerenciamento de domínio, você pode alterar propriedades de domínio, anexar dados de referência a um domínio, gerenciar regras de domínio, gerenciar valores de domínio e inserir relações de dados, além de criar, excluir, importar ou exportar domínios. Você também pode usar domínios compostos que agregam mais de um domínio único. Para obter mais informações, consulte Bases de Dados de Conhecimento DQS e domínios.
Política de Correspondência
Uma política de correspondência contém as regras de correspondência usadas para executar a eliminação de duplicação de dados. O processo de política de correspondência permite a você criar regras de correspondência, ajustá-las com base nos resultados correspondentes e na criação de perfis de dados, além de adicionar a política à base de dados de conhecimento. Para obter mais informações, consulte Correspondência de dados.
Serviços de Dados de Referência
Você pode usar dados de referência para validar, corrigir e enriquecer seus dados, aproveitando os serviços de empresas que garantem a qualidade dos seus dados de referência. Você pode usar os serviços do Windows Azure Marketplace para se conectar a provedores de dados de referência ou pode usar uma conexão direta a um provedor. Para obter mais informações, consulte Serviços de Dados de Referência no DQS.
Para obter mais informações sobre o gerenciamento de conhecimento no DQS, consulte Bases de Dados de Conhecimento DQS e domínios.
[Início]
Conceitos de projeto de qualidade de dados
O administrador de dados executa operações de qualidade de dados (limpeza e correspondência) usando um projeto de qualidade de dados no aplicativo do Cliente Data Quality.
Limpeza de Dados
A limpeza de dados no DQS é feita com base no conhecimento em uma base de dados de conhecimento do DQS. A limpeza de dados no DQS é um processo de duas etapas:
Limpeza auxiliada por computador: o DQS usa o conhecimento na base de dados de conhecimento selecionada para o projeto de limpeza para propor correções/sugestões aos valores em uma fonte de dados.
Limpeza interativa: o administrador de dados pode executar o processo de limpeza interativo para alterar ou aumentar correções de dados que foram propostas pelo processo de limpeza de dados assistida por computador. O administrador de dados faz isso usando níveis de confiança e estatísticas identificadas pelo processo de limpeza de dados, ou inserindo manualmente suas próprias alterações no projeto.
Depois de limpar dados, o administrador de dados pode exportar os dados processados para um banco de dados do SQL Server, .csv ou um arquivo do Excel. Para obter mais informações, consulte Limpeza de Dados.
Correspondência de dados
O processo de correspondência permite ao administrador de dados comparar dados de forma que dados semelhantes, mas com ligeiras diferenças, possam ser alinhados através de um processo de eliminação de duplicação. O DQS executa a eliminação de duplicação com base em regras de correspondência contidas na base de dados de conhecimento; o administrador de dados especifica parâmetros para o processo de correspondência dentro de um projeto de qualidade de dados. Para obter mais informações, consulte Correspondência de dados.
Criação de perfis e notificações
A criação de perfil de dados fornece aos administradores de dados estatísticas em tempo real e informações sobre os dados que estão sendo processados pelo DQS para as atividades de limpeza e correspondência enquanto executa um projeto de qualidade de dados. A criação de perfil de dados ajuda a avaliar a efetividade das atividades de limpeza e correspondência em um projeto de qualidade de dados, e as notificações ajudam o usuário com ações que podem ser realizadas para aprimorar as atividades de limpeza de dados e correspondência de dados. Para obter mais informações, consulte Perfil de dados e notificações no DQS.
Para obter mais informações sobre projetos de qualidade de dados no DQS, consulte Projetos de qualidade de dados (DQS).
[Início]
Conceitos de administração do Data Quality
Um administrador de DQS pode executar a variedade de tarefas administrativas usando o aplicativo Cliente Data Quality.
Monitoramento de Atividades
O monitoramento de atividades exibe o status e o estado de cada atividade executada em um intervalo de dados, fornece dados para cada atividade e permite que os administradores do DQS controlem uma atividade. Para obter mais informações, consulte Monitorar atividade do DQS.
Configuração
A opção de Configuração permite que você:
Defina configurações de serviço de dados de referência. Para obter mais informações, consulte Configurar DQS para usar dados de referência.
Defina os valores de limites para atividades de limpeza e correspondência. Para obter mais informações, consulte Configurar valores de limite para limpeza e correspondência.
Habilitar/desabilitar notificações de criação de perfil. Para obter mais informações, consulte Habilitar/desabilitar notificações de criação de perfil no DQS.
Configure níveis de severidade para os arquivos de log do DQS no nível baseado em atividade ou no nível mais avançado baseado em módulo. Para obter mais informações, consulte Configurar níveis de severidade para arquivos de log do DQS.
Segurança do DQS
Você usa funções do mecanismo de segurança do SQL Server para tornar o DQS seguro. Há três funções de DQS que determinam o nível de acesso para um usuário no aplicativo Cliente Data Quality: dqs_administrator, dqs_kb_editor e dqs_kb_operator. Você não pode conceder funções aos usuários usando o aplicativo Cliente Data Quality; isso é feito usando o SQL Server Management Studio. Para obter mais informações, consulte Segurança do DQS.
Para obter mais informações sobre a administração do DQS, consulte Administração do DQS.
[Início]