Como trabalhar com valores duplicados

É possível trabalhar com conjuntos duplicados de valores por meio de transformações que removem dados duplicados ou filtrar os dados para mostrar somente as duplicações, tornando possível se concentrar neles.

Aviso

O Power Query diferencia maiúsculas e minúsculas. Ao trabalhar com valores duplicados, o Power Query considera as maiúsculas e minúsculas do texto, que pode levar a resultados indesejados. Como solução alternativa, os usuários podem aplicar uma transformação de maiúsculas ou minúsculas antes de remover as duplicações.

Neste artigo, os exemplos usam a tabela a seguir com as colunas id, Category e Total.

Exemplo de tabela inicial.

Remover duplicatas

Uma das operações que se pode executar é remover valores duplicados da tabela.

  1. Selecione as colunas que contêm os valores duplicados.

  2. Acesse a guia Página Inicia.

  3. No grupo Reduzir linhas, selecione Remover linhas.

  4. No menu suspenso, selecione Remover duplicidades.

    Remover duplicatas.

Aviso

Não há garantia de que a primeira instância em um conjunto de duplicidades será escolhida quando as duplicações forem removidas. Para saber mais sobre como preservar a classificação, consulte Preservar classificação.

Remover duplicidades de várias colunas

Neste exemplo, identificaremos e removeremos as duplicidades usando todas as colunas da tabela.

Tabela inicial com duplicatas em várias colunas.

Há quatro linhas duplicadas. O objetivo é remover essas linhas duplicadas para que haja apenas linhas exclusivas na tabela. Selecione todas as colunas da tabela e clique em Remover duplicidades.

O resultado dessa operação lhe fornecerá a tabela que você esperava.

Tabela final com duplicatas removidas de todas as colunas.

Observação

Essa operação também pode ser executada com um subconjunto de colunas.

Remover duplicidades de uma única coluna

Neste exemplo, identificaremos e removeremos as duplicidades usando apenas a coluna Category da tabela.

Tabela inicial com duplicatas na coluna Categoria.

Removeremos essas duplicidades e manteremos apenas os valores exclusivos. Para remover as duplicidades da coluna Category, selecione a coluna e clique em Remover duplicidades.

O resultado dessa operação lhe fornecerá a tabela que você esperava.

Tabela final com duplicatas removidas da coluna Categoria.

Manter as duplicidades

Outra operação que se pode executar com as duplicações é manter apenas as duplicidades encontradas na tabela.

  1. Selecione as colunas que contêm os valores duplicados.

  2. Acesse a guia Página Inicia.

  3. No grupo Reduzir linhas, selecione Manter linhas.

  4. No menu suspenso, selecione Manter duplicidades.

    Manter duplicatas.

Manter duplicidades de várias colunas

Neste exemplo, identificaremos e manteremos as duplicidades usando todas as colunas da tabela.

Tabela inicial para manter duplicatas de várias colunas.

Há quatro linhas duplicadas. O objetivo neste exemplo é manter apenas as linhas duplicadas na tabela. Selecione todas as colunas da tabela e clique em Manter duplicidades.

O resultado dessa operação lhe fornecerá a tabela que você esperava.

Tabela final com apenas linhas duplicadas de várias colunas.

Remover duplicidades de uma única coluna

Neste exemplo, identificaremos e manteremos as duplicidades usando apenas a coluna id da tabela.

Tabela inicial para manter duplicatas de uma única coluna.

Neste exemplo, há várias duplicidades e manteremos apenas essas duplicações na tabela. Para manter as duplicidades da coluna id, selecione a coluna id e clique em Manter duplicidades.

O resultado dessa operação lhe fornecerá a tabela que você esperava.

Tabela final com apenas linhas duplicadas de uma única coluna.

Confira também

Ferramentas de perfil de dados