Combinar arquivos CSV
No Power Query, pode combinar vários ficheiros de uma determinada origem de dados. Este artigo descreve como a experiência funciona quando os arquivos que você deseja combinar são arquivos CSV. Para obter mais informações: Visão geral de combinar arquivos
Gorjeta
Você pode acompanhar este exemplo baixando os arquivos de exemplo usados neste artigo a partir deste link de download. Você pode colocar esses arquivos na fonte de dados de sua escolha, como uma pasta local, pasta do SharePoint, armazenamento de Blob do Azure, Armazenamento do Azure Data Lake ou outra fonte de dados que forneça a exibição do sistema de arquivos.
Para simplificar, o exemplo neste artigo usa o conector de pasta. Para obter mais informações: Pasta
Para combinar arquivos, é imperativo que todos tenham a mesma estrutura e a mesma extensão. Todos os arquivos usados neste exemplo têm a mesma estrutura e extensão (.csv).
Existem 12 ficheiros CSV, um para cada mês do ano civil de 2019. A imagem a seguir mostra as primeiras 15 linhas do arquivo para o mês de janeiro.
O número de linhas varia de arquivo para arquivo, mas todos os arquivos têm uma seção de cabeçalho nas quatro primeiras linhas. Eles têm cabeçalhos de coluna na quinta linha, e os dados da tabela começam na sexta linha e continuam por todas as linhas subsequentes.
O objetivo é combinar todos os 12 arquivos em uma única tabela. Esta tabela combinada contém a linha de cabeçalho na parte superior da tabela e inclui o nome da fonte, data, país, unidades e dados de receita para todo o ano em colunas separadas após a linha de cabeçalho.
Ao conectar-se à pasta que hospeda os arquivos que você deseja combinar — neste exemplo, o nome dessa pasta é Arquivos CSV — você verá a caixa de diálogo de visualização da tabela, que exibe o caminho da pasta no canto superior esquerdo. A visualização de dados mostra a exibição do sistema de arquivos.
Para este exemplo, selecione Combinar.
Nota
Em uma situação diferente, você pode selecionar Transformar dados para filtrar e transformar ainda mais os dados antes de combinar os arquivos. Selecionar Combinar só é recomendado quando você tem certeza de que a pasta contém apenas os arquivos que você deseja combinar.
Depois de selecionar Combinar na visualização da tabela, a caixa de diálogo Combinar arquivos será exibida.
Nota
O Power Query deteta automaticamente o conector a utilizar com base no primeiro ficheiro encontrado na lista. Para saber mais sobre o conector CSV, vá para Texto/CSV.
Para este exemplo, deixe todas as configurações padrão (Arquivo de exemplo definido como Primeiro arquivo e os valores padrão para Origem do arquivo, Delimitador e Deteção de tipo de dados).
Agora selecione Transformar dados no canto inferior direito para ir para a consulta de saída.
Depois de selecionar Transformar dados na caixa de diálogo Combinar ficheiros , será redirecionado para o Editor do Power Query na consulta que criou inicialmente a partir da ligação à pasta local. A consulta de saída agora contém o nome do arquivo de origem na coluna mais à esquerda, juntamente com os dados de cada um dos arquivos de origem nas colunas restantes.
No entanto, os dados não estão na forma correta. Você precisa remover as quatro linhas superiores de cada arquivo antes de combiná-las. Para fazer essa alteração em cada arquivo antes de combiná-los, selecione a consulta Transformar arquivo de exemplo no painel Consultas no lado esquerdo da tela.
Nesta consulta de arquivo de exemplo de transformação, os valores na coluna Data indicam que os dados são para o mês de abril, que tem o formato ano-mês-dia (AAAA-MM-DD). O 2019.csv de abril é o primeiro arquivo exibido na visualização da tabela.
Agora você precisa aplicar um novo conjunto de transformações para limpar os dados. Cada transformação será convertida automaticamente em uma função dentro do grupo de consultas auxiliares que será aplicada a cada arquivo na pasta antes de combinar os dados de cada arquivo.
As transformações que precisam ser adicionadas à consulta de arquivo Transform Sample são:
Remover linhas superiores: para executar esta operação, selecione o menu de ícones da tabela no canto superior esquerdo da tabela e, em seguida, selecione Remover linhas superiores.
Na caixa de diálogo Remover linhas superiores, digite 4 e selecione OK.
Depois de selecionar OK, sua tabela não terá mais as quatro primeiras linhas.
Usar a primeira linha como cabeçalhos: selecione o ícone da tabela novamente e, em seguida, selecione Usar a primeira linha como cabeçalhos.
O resultado dessa operação promoverá a primeira linha da tabela para os novos cabeçalhos de coluna.
Após a conclusão desta operação, o Power Query tentará detetar automaticamente os tipos de dados das colunas e adicionar um novo passo Tipo de coluna alterado.
Ao voltar para a consulta Arquivos CSV, você notará que a última etapa está fornecendo um erro que diz "A coluna 'Coluna1' da tabela não foi encontrada". A razão por trás desse erro é que o estado anterior da consulta estava fazendo uma operação em uma coluna chamada Column1. Mas, devido às alterações feitas na consulta do arquivo Transform Sample, essa coluna não existe mais. Para obter mais informações: Lidar com erros no Power Query
Você pode remover esta última etapa da consulta do painel Etapas aplicadas selecionando o ícone X delete no lado esquerdo do nome da etapa. Depois de excluir esta etapa, sua consulta mostrará os resultados corretos.
No entanto, observe que nenhuma das colunas derivadas dos arquivos (Data, País, Unidades, Receita) tem um tipo de dados específico atribuído a elas. Atribua o tipo de dados correto a cada coluna usando a tabela a seguir.
Nome da coluna | Tipo de dados |
---|---|
Date | Date |
País | Texto |
Unidades | Número inteiro |
Receita | Moeda |
Depois de definir os tipos de dados para cada coluna, você estará pronto para carregar a tabela.
Nota
Para saber como definir ou alterar tipos de dados de coluna, vá para Tipos de dados.
Para validar que todos os arquivos foram combinados, você pode selecionar o ícone de filtro no título da coluna Source.Name , que exibirá todos os nomes dos arquivos que foram combinados. Se você receber o aviso "A lista pode estar incompleta", selecione Carregar mais na parte inferior do menu para exibir mais valores disponíveis na coluna.
Depois de selecionar Carregar mais, todos os nomes de arquivo disponíveis serão exibidos.