Compartilhar via


Definir regras de correspondência para unificação de dados

Esta etapa na unificação define a ordem de correspondência e as regras de correspondência entre tabelas. Ela requer pelo menos duas tabelas. Quando coincidirem, os registros serão concatenados em um único registro com todos os campos de cada tabela. Linhas alternativas (linhas não vencedoras da etapa de eliminação de duplicação) são levadas em consideração na correspondência. Mas, se uma linha corresponder a uma linha alternativa em uma tabela, o registro será comparado com a linha vencedora.

Observação

Depois de criar as condições de correspondência e selecionar Avançar, você não poderá remover uma tabela ou uma coluna selecionada. Se necessário, selecione Voltar para revisar as tabelas e as colunas selecionadas antes de continuar.

As etapas e imagens a seguir refletem a primeira vez que você passa pelo processo de unificação. Para editar as configurações de unificação existentes, consulte Atualizar as configurações de unificação.

Incluir tabelas enriquecidas (versão preliminar)

Se você enriqueceu tabelas no nível da fonte de dados para ajudar a melhorar seus resultados de unificação, selecione-as. Para obter mais informações, consulte Enriquecimento de fontes de dados. Se tiver selecionado tabelas enriquecidas na página Regras de eliminação de duplicação, você não precisará selecioná-las novamente.

  1. Na página Regras de correspondência, selecione Usar tabelas enriquecidas na parte superior.

  2. No painel Usar tabelas enriquecidas, selecione uma ou mais tabelas enriquecidas.

  3. Escolha Concluído.

Especifique a ordem de correspondência

Cada correspondência unifica duas ou mais tabelas em uma única tabela consolidada. Ao mesmo tempo, ela mantém os registros exclusivos do cliente. A ordem de correspondência indica a ordem em que o sistema tenta corresponder os registros.

Importante

A primeira tabela é chamada de tabela primária, que serve como base para seus perfis unificados. As tabelas adicionais selecionadas serão adicionadas a essa tabela.

Considerações importantes:

  • Escolha a tabela com os dados de perfil mais completos e confiáveis sobre seus clientes como a tabela principal.
  • Escolha a tabela que tem diversas colunas em comum com outras tabelas (por exemplo, nome, número de telefone ou endereço de email) como a tabela primária.
  • As tabelas só podem coincidir com outras tabelas de prioridade mais alta. Portanto, a Tabela2 só pode coincidir com a Tabela1, e a Tabela3, com a Tabela2 ou a Tabela1.
  1. Na página Regras de correspondência, use as setas para cima e para baixo a fim de mover as tabelas na ordem desejada ou arraste e solte-as. Por exemplo, selecione eCommerceContacts como a tabela principal e loyCustomer como a segunda tabela.

  2. Para ter todos os registros na tabela como um cliente exclusivo independentemente de uma correspondência ser encontrada ou não, selecione Incluir todos os registros. Quaisquer registros nessa tabela não correspondentes a registros em outra tabela serão incluídos no perfil unificado. Os registros que não têm correspondência são chamados de singletons.

A tabela principal eCommerceContacts corresponde à próxima tabela loyCustomer. O conjunto de dados resultante da primeira etapa de correspondência com a tabela a seguir caso você tenha mais de duas tabelas. Se ainda houver duplicatas em eCommerceContacts, quando loyCustomer for comparado com eCommerceContacts, as linhas duplicadas eCommerceContacts não serão reduzidas a um único registro do cliente. No entanto, se as linhas duplicadas em loyCustomer corresponderem a uma linha em eCommerceContacts, elas serão reduzidas a um único registro do cliente.

Captura de tela da ordem de correspondência selecionada para as tabelas.

Definir regras para pares de correspondência

As regras de correspondência especificam a lógica pela qual um par específico de tabelas será correspondido. Uma regra consiste em uma ou mais condições.

O aviso ao lado de um nome de tabela significa que nenhuma regra de correspondência está definida para um par de correspondência.

  1. Selecione Adicionar regra para um par de tabelas a fim de definir regras de correspondência.

  2. No painel Adicionar regra, configure as condições para a regra.

    Captura de tela do painel Adicionar regra.

    • Selecione Tabela/Campo (primeira linha): escolha uma tabela e uma coluna que provavelmente sejam exclusivas de um cliente. Por exemplo, um número de telefone ou endereço de email. Evite a correspondência por colunas do tipo de atividade. Por exemplo, um ID de compra provavelmente não encontrará correspondência em outros tipos de registro.

    • Selecionar Tabela/Campo (segunda linha): escolha uma coluna relacionada à coluna da tabela especificada na primeira linha.

    • Normalizar: Select opções de normalização para a coluna.

      • Numerais: converte símbolos Unicode que representam números em números simples.
      • Símbolos: Remove símbolos e caracteres especiais como !"#$%&'()*+,-./:;<=>? @[]^_`{|}~. Por exemplo, Head&Shoulder se torna HeadShoulder.
      • Texto em minúsculas: converte caracteres maiúsculos em minúsculos. "ALL CAPS and Title Case" se torna "all caps and title case".
      • Tipo (telefone, nome, endereço, organização): padroniza nomes, cargos, números de telefone e endereços.
      • Unicode para ASCII: converte caracteres Unicode em letras ASCII equivalentes. Por exemplo, o ề acentuado é convertido no caractere e.
      • Espaço em branco: remove todos os espaços. Olá, Mundo torna-se Olá,Mundo.
      • Alias ​​mapeamento: permite fazer upload de uma lista personalizada de pares de strings para indicar strings que sempre devem ser consideradas uma correspondência exata.
      • Ignorar personalizado: permite fazer upload de uma lista personalizada de strings para indicar strings que nunca devem ser correspondidas.
    • Precisão: defina o nível de precisão a ser aplicado a esta condição. A precisão é usada para correspondência exata e correspondência difusa e determina o quão próximas duas strings precisam estar para serem consideradas uma correspondência.

      • Básico: escolha entre Baixo (30%), Médio (60%), Alto (80%) e Exato (100%). Selecione Exato para corresponder apenas os registros com 100% de correspondência.
      • Personalizado: defina uma porcentagem de correspondência para os registros. O sistema só fará a corresponderá dos registros que ultrapassarem esse limite.
    • Nome: nome da regra.

  3. Para só comparar tabelas se as colunas atenderem a várias condições, selecione Adicionar>Adicionar condição para adicionar mais condições a uma regra de correspondência. As condições são conectadas a um operador lógico AND e, portanto, somente serão executadas se todas as condições forem atendidas.

  4. Opcionalmente, considere opções avançadas, como exceções ou condições de correspondência personalizadas.

  5. Selecione Concluído para finalizar a regra.

  6. Opcionalmente, adicione mais regras.

  7. Selecione Avançar.

Adicionar regras a um par de correspondência

As regras de correspondência representam conjuntos de condições. Para comparar tabelas por condição com base em várias colunas, adicione mais regras.

  1. Selecione Adicionar regra na tabela à qual você deseja adicionar regras.

  2. Siga as etapas em Definir regras para pares de correspondência.

Nota

A ordem das regras é importante. O algoritmo de correspondência tentará fazer a correspondência de um determinado registro do cliente com base na primeira regra e avançará para a segunda regra somente se nenhuma correspondência for identificada com a primeira.

Opções avançadas

Adicionar exceções a uma regra

Na maioria dos casos, a correspondência de tabelas resulta em perfis de cliente exclusivos com dados consolidados. Para gerenciar casos raros de falsos positivos e falsos negativos, defina exceções para uma regra de correspondência. As exceções são aplicadas após o processamento das regras de correspondência e evitam a correspondência de todos os registros que atendem aos critérios de exceção.

Por exemplo, se sua regra de correspondência combinar sobrenome, cidade e data de nascimento, o sistema identificará gêmeos com o mesmo sobrenome que moram na mesma cidade com o mesmo perfil. Você poderá especificar uma exceção que não corresponda aos perfis se o nome nas tabelas combinadas não for o mesmo.

  1. No painel Editar regra, selecione Adicionar>Adicionar exceção.

  2. Especifique os critérios de exceção.

  3. Selecione Concluído para salvar a regra.

Especificar condições de correspondência personalizadas

Especifique as condições que substituem a lógica de correspondência padrão. Há quatro opções disponíveis:

Opção Descrição Exemplo
Sempre corresponder Define valores para as chaves primárias que sempre são correspondidas. Sempre corresponda a linha com a chave primária 12345 à linha com a chave primária 54321.
Nunca corresponder Define valores para as chaves primárias que nunca correspondem. Nunca corresponda a linha com a chave primária 12345 com a linha com a chave primária 54321.
Bypass Define valores que o sistema deve sempre ignorar na fase de correspondência. Ignorar os valores 11111 e Desconhecido durante a correspondência.
Mapeamento de alias Define valores que o sistema deve levar em consideração como o mesmo valor. Considerar Joe igual a Joseph.
  1. Selecione Personalizado.

    Botão Personalizado

  2. Escolha o Tipo personalizado e selecione Baixar modelo. Renomeie o modelo sem usar espaços. Use um modelo separado para cada opção de correspondência.

  3. Abra o arquivo de modelo baixado e preencha os detalhes. O modelo contém campos para especificar os valores da chave primária da tabela e a tabela a serem usados na correspondência personalizada. Os nomes das tabelas diferenciam maiúsculas e minúsculas. Por exemplo, se você quiser que a chave primária 12345 da tabela Vendas sempre corresponda à chave primária 34567 da tabela Contato, preencha no modelo:

    • Tabela1: Vendas
    • Tabela1Chave: 12345
    • Tabela2: Contato
    • Tabela2Chave: 34567

    O mesmo arquivo de modelo pode especificar registros de correspondência personalizados de várias tabelas.

    Se você deseja especificar a correspondência personalizada para desduplicação em uma tabela, forneça a mesma tabela como Tabela1 e Tabela2 e defina os diferentes valores de chave primária. Você deve definir pelo menos uma regra de desduplicação para a tabela usar a correspondência personalizada.

  4. Depois de adicionar todas as substituições, salve o arquivo de modelo.

  5. Acesse Dados>Fontes de dados e ingira os arquivos de modelo como novas tabelas.

  6. Após carregar os arquivos, selecione a opção Personalizado novamente. Selecione as tabelas necessárias no menu suspenso e selecione Concluído.

    Captura de tela da caixa de diálogo para escolher substituições para um cenário de correspondência personalizado.

  7. A aplicação da correspondência personalizada depende da opção de correspondência que você deseja usar.

    • Para Sempre corresponder ou Nunca corresponder, prossiga para a próxima etapa.
    • Para Bypass ou Mapeamento de alias, selecione Editar em uma regra de correspondência existente ou crie uma. Na lista suspensa Normalizações, escolha a opção Bypass personalizado ou Mapeamento de alias e selecione Concluído.
  8. Selecione Concluído no painel Personalizado para aplicar a configuração de correspondência personalizada.

    Cada arquivo de modelo ingerido é sua própria fonte de dados. Se forem descobertos registros que precisam de tratamento de correspondência especial, atualize a fonte de dados apropriada. A atualização será usada durante o próximo processo de unificação. Por exemplo, você identifica gêmeos com quase o mesmo nome que vivem no mesmo endereço que foi mesclado como uma pessoa. Atualize a fonte de dados para identificar os gêmeos como registros separados e exclusivos.