Definir propriedades do domínio
Este tópico descreve como definir propriedades de domínio no Data Quality Services (DQS).
Neste tópico
Antes de começar:
Pré-requisitos
Segurança
Definir propriedades do domínio
Acompanhamento: após definir propriedades de domínio
Propriedades do Domínio
Nome e descrição de domínio
Tipo de dados
Usar Valores Principais
Cadeia de Caracteres de Normalização
Formato de Saída para
Idioma
Habilitar Verificador Ortográfico
Desabilitar Algoritmos de Erro de Sintaxe
Antes de começar
Pré-requisitos
Para definir propriedades para um domínio, você precisa criar uma base de dados de conhecimento e um domínio.
Segurança
Permissões
Você deve ter a função dqs_kb_editor ou dqs_administrator no banco de dados DQS_MAIN para definir propriedades em um domínio.
[Início]
Definir propriedades do domínio
Defina as propriedades em um domínio existente abrindo uma base de dados de conhecimento na atividade Gerenciamento de Domínio (consulte Abrir uma base de dados de conhecimento) e selecione o domínio apropriado na lista Domínios. A página Propriedades de Domínio será exibida por padrão.
Defina as propriedades em um novo domínio depois de criá-la conforme descrito em Criar um domínio.
Clique em Concluir para concluir a atividade de gerenciamento de domínio, conforme descrito em Terminar a atividade Gerenciamento de Domínio.
[Início]
Acompanhamento: após definir propriedades de domínio
Após definir propriedades de domínio, você poderá executar outras tarefas de gerenciamento de domínio, executar a descoberta da base de dados de conhecimento para adicionar conhecimento ao domínio ou adicionar uma política de correspondência ao domínio. Para obter mais informações, consulte Executar a descoberta da base de dados de conhecimento, Gerenciando um domínio ou Criar uma política de correspondência.
[Início]
Propriedades do Domínio
Nome e descrição de domínio
Quando um domínio é criado, o nome ou a descrição do domínio pode ser alterado. O nome do domínio deve ser exclusivo para a base de dados de conhecimento. A descrição pode ter até 256 caracteres.
Tipo de dados
Quando você criar o domínio, selecione um dos tipos de dados a seguir para obter os valores no domínio: Cadeia de Caracteres (o padrão), Data, Inteiro ou Decimal. Depois de criar o domínio, você poderá exibir o tipo de dados, mas não poderá alterá-lo O tipo de dados selecionado para um domínio define o tipo de dados de origem que pode ser mapeado para o domínio. Para obter informações sobre tipos de dados com suporte para cada um dos quatro tipos de dados de domínio no DQS, consulte O SQL Server com suporte e tipos de dados do SSIS para domínios do DQS.
Usar Valores Principais
Marque esta caixa de seleção para especificar que o valor principal em um grupo de sinônimos será gerado, e não um valor que é sinônimo dele. Cancele a seleção de Usar Valores Principais para especificar que cada valor de sinônimo seja gerado em sua forma correta ou corrigida, e não seja substituído pelo valor principal do seu grupo.
Cadeia de Caracteres de Normalização
Se o tipo de dados for String, selecione a caixa de seleção para ignorar os caracteres especiais nos dados de origem. O DQS substitui internamente os caracteres especiais por nulo ou por um espaço quando os dados forem carregados no domínio. Um caracteres de dois-pontos, hífen, ponto, aspas duplas ou ponto-e-vírgula é substituído por um espaço. Um caracteres de aspas simples é substituído por um nulo. O uso do nulo associa as duas partes da cadeia de caracteres.
Ignorar os caracteres especiais em um valor da cadeia de caracteres pode aumentar a precisão da correspondência. A pontuação de similaridade entre duas cadeias de caracteres pode ser aumentada, substituindo caracteres especiais por um nulo ou um espaço. Marcas de pontuação ou outros símbolos têm grande probabilidade de serem diferentes em cadeias de caracteres diferentes. A substituição interna de caracteres especiais pode permitir que a pontuação ultrapasse o limite mínimo de correspondência no DQS, levando duas cadeias de caracteres a serem consideradas correspondentes, quando, do contrário, isso não ocorreria. Entretanto, a opção por ignorar caracteres especiais poderá depender do tipo de dados no qual você está executando a correspondência. Por exemplo, quando você estiver trabalhando com dados no Sistema de medidas em inglês, ignorar as aspas duplas e aspas simples em dados do produto poderá resultar em falsos positivos se uma aspa dupla representar uma polegada e uma aspa simples representar uma medida em pés.
A normalização é executada quando dados são carregados e indexados nas fases de processamento de dados de descoberta, política de correspondência, projeto de correspondência e atividades de projeto de limpeza. Se habilitada, a normalização e a transformação de relações baseada em termos serão ambas realizadas em uma fase de pré-processamento antes da análise. Elas são executados em cada domínio antes de qualquer algoritmo ser aplicado que compute a semelhança entre cadeias de caracteres. Se a análise de domínio composto for solicitada, ela será executada antes da transformação na normalização e nas relações baseadas em termos, pois a análise de delimitador requer símbolos. Outras operações, como regras de domínio e alterações de valor de domínio, serão executadas depois das transformações. Os dados resultantes não são alterados pela substituição interna de caracteres especiais no DQS.
Formato de Saída para
Selecione a formatação que será aplicada quando forem gerados os valores de dados no domínio. A formatação é específica do tipo de dados selecionado, conforme mostrado na lista a seguir. Selecionar Nenhum significa que nenhum formato da lista será aplicado.
Para um valor da cadeia de caracteres, você pode especificar que a cadeia de caracteres seja gerada como maiúsculas, minúsculas ou inicial maiúscula.
Para um valor de data, você pode especificar o formato do dia, mês e ano.
Para um valor inteiro, você pode especificar o tipo de máscara de formato a ser aplicado.
Para um valor decimal, você pode especificar a precisão e o tipo de máscara de formato a ser aplicado.
Idioma
Se o tipo de dados for Cadeia de Caracteres, selecione o idioma a ser associado ao domínio para a operação do verificador ortográfico. Esta seleção só se aplica ao verificador ortográfico, pois os resultados do verificador ortográfico dependem do idioma em uso. A seleção se aplica apenas a um único domínio com um tipo de dados cadeia de caracteres. A propriedade de idioma não é relevante para domínios compostos. O idioma para cada parte de um domínio composto é determinado pelo único domínio relevante.
O idioma padrão é inglês. A definição da propriedade Idioma como Outro desabilita o verificador ortográfico para o domínio.
Dica |
---|
Se o idioma não for exibido na lista suspensa Idioma, selecione Outro. Isso garante que o DQS limpe e elimine duplicatas para os dados de idiomas não listados com base no conhecimento disponível (regras de domínio, valores de domínio, TBRs, regra de correspondência) no domínio. Para obter mais informações sobre limpeza e correspondência de idiomas não listados, consulte a postagem de blog: Idiomas com suporte do DQS para limpeza e correspondência. |
Habilitar Verificador Ortográfico
Se o tipo de dados for Cadeia de Caracteres, clique para habilitar o verificador ortográfico do DQS para o domínio. O verificador ortográfico só funciona em domínios com um tipo de dados cadeia de caracteres. A caixa de seleção Habilitar Verificador Ortográfico habilita o verificador ortográfico apenas para o único domínio associado com a caixa de seleção. A caixa de seleção não se aplica a um domínio composto.
O verificador ortográfico propõe correções de sintaxe e validação em valores no domínio. Para obter mais informações, consulte Usar o verificador ortográfico DQS.
Desabilitar Algoritmos de Erro de Sintaxe
Se o tipo de dados for Cadeia de Caracteres, selecione para especificar que erros de sintaxe não sejam identificados pelo DQS no domínio durante a limpeza. Marque esta caixa de seleção quando a identificação de erros de sintaxe para esse domínio for irrelevante. Por exemplo, a identificação de erros de sintaxe pode não ter importância para um número de série. Este controle só está disponível para o tipo de dados cadeia de caracteres. O DQS não verificará se existem erros de sintaxe em tipos de dados que não sejam cadeia de caracteres.
[Início]