Tutorial: Formatar e combinar dados no Power BI Desktop

Com o Power BI Desktop, você pode se conectar a muitos tipos diferentes de fontes de dados e, em seguida, formatar esses dados de acordo com suas necessidades, possibilitando a criação de relatórios visuais para compartilhar com outras pessoas. Formatar dados significa transformá-los: renomear colunas ou tabelas, converter texto em números, remover linhas, definir a primeira linha como títulos etc. Combinar dados significa conectar-se a duas ou mais fontes de dados, formatá-las conforme necessário e, em seguida, consolidá-las em uma consulta única.

Neste tutorial, você aprenderá como:

  • Formatar dados usando o Editor do Power Query.
  • Conectar-se a diferentes fontes de dados.
  • Combinar essas fontes de dados e criar um modelo de dados a ser usado em relatórios.

Este tutorial demonstra como formatar uma consulta usando o Power BI Desktop, destacando as tarefas mais comuns. A consulta usada aqui é descrita mais detalhadamente, incluindo como criar a consulta do zero, em Introdução ao Power BI Desktop.

O Editor do Power Query no Power BI Desktop usa os menus acionados por clique com o botão direito do mouse e a faixa de opções Transformar. A maioria das opções que você pode selecionar na faixa de opções também está disponível com um clique do botão direito do mouse em um item, como uma coluna, e com a seleção de uma opção no menu que é exibido.

Formatar dados

Para formatar dados no Editor do Power Query, você fornece instruções detalhadas para que o Editor do Power Query ajuste os dados conforme eles são carregados e apresentados. A fonte de dados original não é afetada; apenas essa exibição específica dos dados é ajustada ou formatada.

As etapas especificadas (como renomear uma tabela, transformar um tipo de dados ou excluir uma coluna) são registradas pelo Editor do Power Query. Toda vez que essa consulta se conecta à fonte de dados, o Editor do Power Query executa essas etapas para que os dados sempre sejam formatados da maneira que você especificar. Esse processo ocorre sempre que você usa o Editor do Power Query ou para qualquer pessoa que usa a sua consulta compartilhada, como no serviço do Power BI. Essas etapas são capturadas sequencialmente no painel Configurações de Consulta, em ETAPAS APLICADAS. Veremos cada uma dessas etapas neste artigo.

Screenshot of Power Query Editor with the Query Settings pane and Applied steps list.

  1. Importe os dados de uma fonte da Web. Selecione o menu suspenso Obter dados e escolha Web.

    Screenshot of Power Query Editor with the Get data menu and Web source selected.

  2. Cole essa URL na caixa de diálogo Da Web e selecione OK.

    https://www.fool.com/research/best-states-to-retire
    

    Screenshot of Power Query Editor's From Web dialog with the source page's URL entered.

  3. Na caixa de diálogo Navegador, selecione Table 1 e escolha Transformar Dados.

    Screenshot of Power Query Editor's Navigator dialog with HTML Table 1 selected and the Transform Data button highlighted.

Dica

Algumas informações nas tabelas da URL anterior podem ser alteradas ou atualizadas ocasionalmente. Como resultado, talvez seja necessário ajustar as seleções ou etapas neste artigo adequadamente.

  1. A janela do Editor do Power Query é exibida. Você pode ver as etapas padrão aplicadas até agora, no painel Configurações de Consulta em ETAPAS APLICADAS.

    • Fonte: conexão ao site.
    • Tabela Extraída do HTML: seleção da tabela.
    • Cabeçalhos promovidos: alterando a linha superior de dados em cabeçalhos de coluna.
    • Tipo alterado: alterando os tipos de coluna, que são importados como texto, para seus tipos inferidos.

    Screenshot of the Power Query Editor window with Query Settings highlighted.

  2. Altere o nome da tabela do padrão Table 1 para Retirement Data e pressione Enter.

    Screenshot of Power Query Editor showing how to edit a table name in Query Settings.

  3. Os dados existentes são ordenados por uma pontuação ponderada, como descrito na página da Web de origem em Metodologia. Vamos adicionar uma coluna personalizada para calcular uma pontuação diferente. Em seguida, classificaremos a tabela nesta coluna para comparar a classificação da pontuação personalizada com a Classificação existente.

  4. Na faixa de opções Adicionar Coluna, selecione Coluna Personalizada.

    Screenshot of Power Query Editor's Add Column ribbon with the Custom Column button highlighted.

  5. Na caixa de diálogo Coluna Personalizada, em Nome da nova coluna, insira Nova pontuação. Na Fórmula de coluna personalizada, insira os seguintes dados:

    ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] + [Weather] ) / 8
    
  6. Verifique se a mensagem de status indica Nenhum erro de sintaxe foi detectado e selecione OK.

    Screenshot of Power Query Editor's Custom Column dialog showing the new column name, custom column formula, and no syntax errors.

  7. Em Configurações de Consulta, a lista ETAPAS APLICADAS mostra a nova etapa Personalizada Adicionada que acabamos de definir.

    Screenshot of Power Query Editor's Query Settings pane showing the Applied Steps list with the actions so far.

Ajustar os dados

Antes de trabalharmos com essa consulta, vamos fazer algumas alterações para ajustar os dados:

  • Ajustar as classificações removendo uma coluna.

    Por exemplo, suponha que Clima não seja um fator em nossos resultados. Remover essa coluna da consulta não afeta os outros dados.

  • Corrija os erros.

    Como removemos uma coluna, precisamos ajustar nossos cálculos na coluna Nova pontuação alterando sua fórmula.

  • Classificar os dados.

    Classifique os dados com base na coluna Nova pontuação e compare com a coluna Classificação existente.

  • Substituir os dados.

    Destacaremos como substituir um valor específico e como inserir uma etapa aplicada.

Essas alterações são descritas nas etapas a seguir.

  1. Para remover a coluna Clima, selecione a coluna, escolha a guia Página Inicial na faixa de opções e, em seguida, escolha Remover Colunas.

    Screenshot of Power Query Editor's Home menu with the Remove Columns button highlighted.

    Observação

    Os valores de Nova pontuação não foram alterados devido à ordenação das etapas. O Editor do Power Query registra as etapas sequencialmente, mas independentemente, umas das outras. Para aplicar ações em uma sequência diferente, você pode mover cada etapa aplicada para cima ou para baixo.

  2. Clique com o botão direito do mouse em uma etapa para ver o menu de contexto.

    Screenshot of Power Query Editor's Applied Steps context menu.

  3. Mova a última etapa, Colunas Removidas, para logo cima da etapa Personalização Adicionada.

    Screenshot of Power Query Editor's Applied Steps list with the Removed Columns step now moved above the Custom Column step.

  4. Selecione a etapa Personalização Adicionada.

    Observe que a coluna Nova pontuação agora mostra Erro em vez do valor calculado.

    Screenshot of Power Query Editor and the New score column containing Error values.

    Existem várias maneiras de obter mais informações sobre cada erro. Se você selecionar a célula sem clicar na palavra Erro, o Editor do Power Query exibirá as informações de erro.

    Screenshot of Power Query Editor showing the New score column with Error details.

    Se você selecionar a palavra Erro diretamente, o Editor do Power Query criará uma Etapa Aplicada no painel Configurações de Consulta e exibirá as informações sobre o erro. Como não precisamos exibir informações do erro em nenhum lugar, selecione Cancelar.

  5. Para corrigir os erros, há duas alterações necessárias, remover o nome da coluna Clima e alterar o divisor de 8 para 7. Você pode fazer essas alterações de duas maneiras:

    1. Clique com o botão direito do mouse na etapa Coluna Personalizada e selecione Editar Configurações. Isso abre a caixa de diálogo Coluna Personalizada usada para criar a coluna Nova pontuação. Edite a fórmula, como descrito anteriormente, até que se pareça com esta:

      Screenshot of Power Query Editor's Custom Column dialog with formula errors fixed.

    2. Selecione a coluna Nova pontuação e, em seguida, exiba a fórmula de dados da coluna habilitando a caixa de seleção Barra de Fórmulas na guia Exibir.

      Screenshot of Power Query Editor showing the New score column and its data formula with errors fixed.

      Edite a fórmula, como descrito anteriormente, até que se pareça com esta, e pressione Enter.

      = Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)              
      

    O Editor do Power Query substitui os dados pelos valores revisados e a etapa Personalização Adicionada é concluída sem erros.

    Observação

    Selecione também Remover Erros usando a faixa de opções ou o menu de atalho, que remove as linhas com erros. No entanto, neste tutorial, queremos preservar todos os dados na tabela.

  6. Classifique os dados com base na coluna Nova pontuação. Primeiro, selecione a última etapa aplicada, Personalização Adicionada, para exibir os dados mais recentes. Em seguida, selecione a lista suspensa localizada ao lado do cabeçalho de coluna Nova pontuação e escolha Classificar em Ordem Decrescente.

    Screenshot of Power Query Editor showing the New score column with Sort Descending highlighted.

    Agora os dados estão classificados de acordo com a Nova pontuação. Você pode selecionar uma etapa aplicada em qualquer lugar na lista e continuar formatando os dados nesse ponto na sequência. O Editor do Power Query insere de maneira automática uma nova etapa diretamente após a etapa aplicada selecionada no momento.

  7. Em ETAPAS APLICADAS, selecione a etapa que precede a coluna personalizada, que é a etapa Colunas Removidas. Aqui, substituiremos o valor da classificação Custo de habitação no Oregon. Clique com o botão direito na célula apropriada que contém o valor Custo de habitação do Oregon e, em seguida, selecione Substituir Valores. Observe qual Etapa Aplicada está selecionada no momento.

    Screenshot of the Power Query Editor window showing the Housing cost column with the Replace Values right-click menu item highlighted.

  8. Selecione Inserir.

    Como estamos inserindo uma etapa, o Editor do Power Query nos alerta que as etapas seguintes podem causar uma interrupção na consulta.

    Screenshot of Power Query Editor's Insert Step verification dialog.

  9. Altere o valor dos dados para 100,0.

    O Editor do Power Query substitui os dados do Oregon. Quando você cria uma etapa aplicada, o Editor do Power Query a nomeia com base na ação; nesse caso, Valor Substituído. Se você tiver mais de uma etapa com o mesmo nome na consulta, o Editor do Power Query acrescenta um número crescente ao nome de cada etapa aplicada subsequente.

  10. Selecione a última Etapa Aplicada, Linhas Classificadas.

    Observe que os dados foram alterados em relação à nova classificação do Oregon. Essa alteração ocorre porque inserimos a etapa Valor Substituído na localização correta, antes da etapa Personalização Adicionada.

    Agora formatamos nossos dados na medida necessária. Em seguida, vamos nos conectar a outra fonte de dados e combinar dados.

Combinar dados

Os dados sobre vários estados são interessantes e serão úteis para a criação de mais consultas e esforços de análise. Entretanto, a maioria dos dados sobre os estados usam uma abreviação de duas letras para códigos de estado, em vez de utilizar o nome completo do estado. Precisamos de uma maneira de associar os nomes de estados às respectivas abreviações.

Há outra fonte de dados pública que fornece essa associação, mas ela precisa de uma quantidade razoável de formatação antes que possamos conectá-la à nossa tabela de aposentadoria. Para formatar os dados, siga estas etapas:

  1. Na faixa de opções Página Inicial no Editor do Power Query, selecione Nova Fonte > Web.

  2. Insira o endereço do site de abreviações de estados, https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations , e, em seguida, selecione Conectar.

    O Navegador exibirá o conteúdo do site.

    Screenshot of Power Query Editor's Navigator page showing the Codes and abbreviations table selected.

  3. Selecione Códigos e abreviações para estados dos EUA, distrito federal, territórios e outras regiões.

    Dica

    Será necessário uma formatação para reduzir os dados dessa tabela até o que desejamos. Há uma maneira mais rápida ou mais fácil de realizar as seguintes etapas? Sim, podemos criar uma relação entre as duas tabelas e formatar os dados com base nessa relação. As etapas de exemplo a seguir são úteis para aprender a trabalhar com tabelas. No entanto, as relações podem ajudá-lo a usar rapidamente os dados de várias tabelas.

Para colocar os dados em forma, siga estas etapas:

  1. Remova a linha superior. Como ela é o resultado do modo como a tabela da página Web foi criada, não precisamos dela. Na faixa de opções Página Inicial, selecione Remover Linhas > Remover Primeiras Linhas.

    Screenshot of Power Query Editor highlighting the Remove Rows dropdown and the Remove Top Rows item.

    A caixa de diálogo Remover Linhas Superiores é exibida. Especifique 1 linha para ser removida.

  2. Promova a nova linha superior para cabeçalhos com Usar Primeira Linha Como Cabeçalhos na guia Página Inicial ou na guia Transformar na faixa de opções.

  3. Como a tabela Dados de Aposentadoria não contém informações de Washington D.C. ou dos territórios, precisamos filtrá-los de nossa lista. Selecione na lista suspensa da coluna o Nome e o status da região_1, e desmarque todas as caixas de seleção, exceto Estado.

    Screenshot of Power Query Editor showing a column filter with only the State value selected.

  4. Remova todas as colunas desnecessárias. Como precisamos apenas do mapeamento de cada estado para sua abreviação oficial de duas letras (Nome e status da região e colunas ANSI), podemos remover as outras colunas. Primeiro, selecione a coluna Nome e o status da região, mantenha pressionada a tecla CTRL e selecione a coluna ANSI. Na guia Página Inicial da faixa de opções, selecione Remover Colunas > Remover Outras Colunas.

    Screenshot of Power Query Editor highlighting the Remove Columns dropdown and the Remove Other Columns item.

    Observação

    A sequência de etapas aplicadas no Editor do Power Query é importante e afeta a maneira como os dados são moldados. Também é importante considerar como uma etapa pode impactar outra etapa subsequente. Por exemplo, se você remover uma etapa das etapas aplicadas, as etapas subsequentes poderão não se comportar como pretendido originalmente.

    Observação

    Ao redimensionar a janela do Editor do Power Query para diminuir a largura, alguns itens de faixa de opções são condensados para fazer o melhor uso do espaço visível. Ao aumentar a largura da janela do Editor do Power Query, os itens da faixa de opções são expandidos para fazer o melhor uso da área aumentada da faixa de opções.

  5. Renomeie as colunas e a tabela. Há algumas maneiras de renomear uma coluna: primeiro selecione a coluna e depois selecione Renomear na guia Transformar na faixa de opções ou clique com o botão direito do mouse e selecione Renomear. A imagem a seguir mostra ambas as opções, mas você precisa escolher apenas uma.

    Screenshot of Power Query Editor highlighting the Rename button and also the Rename right-click item.

  6. Renomeie as colunas para State Name e State Code. Para renomear a tabela, insira o NomeCódigos de Estado no painel Configurações de Consulta.

    Screenshot of Power Query Editor window showing the results of shaping state codes source data into a table.

Combinar consultas

Agora que formatamos a tabela Códigos de Estado da maneira que desejamos, vamos combinar essas duas tabelas, ou consultas, em uma só. Como as tabelas que temos agora são o resultado das consultas que aplicamos aos dados, elas são geralmente chamadas de consultas.

Há duas maneiras principais de combinar consultas: mesclando e acrescentando.

  • Para uma ou mais colunas que você deseja adicionar a outra consulta, você mescla as consultas.
  • Para uma ou mais linhas de dados que você deseja adicionar a uma consulta existente, você acrescenta a consulta.

Nesse caso, desejamos mesclar as consultas:

  1. No painel esquerdo do Editor do Power Query, selecione a consulta na qual deseja mesclar a outra consulta. Nesse caso, são Dados de Aposentadoria.

  2. Selecione Mesclar Consultas > Mesclar Consultas na guia Página Inicial na faixa de opções.

    Screenshot of Power Query Editor's Merge Queries dropdown with the Merge Queries item highlighted.

    Talvez você precise definir os níveis de privacidade, a fim de garantir que os dados sejam combinados sem incluir nem transferir dados que você não deseja transferir.

    A janela Mesclar será exibida. Ela solicita a seleção da tabela que você deseja mesclar com a tabela selecionada e as colunas correspondentes a serem usadas para a mesclagem.

  3. Selecione State na tabela Dados de Aposentadoria e, em seguida, a consulta Códigos de Estado.

    Quando você seleciona colunas correspondentes, o botão OK é habilitado.

    Screenshot of Power Query Editor's Merge dialog.

  4. Selecione OK.

    O Editor do Power Query cria uma coluna ao final da consulta, que consiste no conteúdo da tabela (consulta) que foi mesclada com a consulta existente. Todas as colunas da consulta mesclada são condensadas na coluna, mas você pode Expandir a tabela e incluir todas as colunas que quiser.

  5. Para expandir a tabela mesclada e selecionar as colunas a serem incluídas, selecione o ícone de expansão ( ).

    A janela Expandir é exibida.

    Screenshot of Power Query Editor's column Expand dialog showing the State Code column highlighted.

  6. Nesse caso, queremos apenas a coluna State Code. Selecione essa coluna, desmarque Usar nome da coluna original como prefixo e, em seguida, selecione OK.

    Se tivéssemos deixado a caixa de seleção marcada para Usar o nome da coluna original como prefixo, a coluna mesclada seria nomeada Código Codes.State Estado.

    Observação

    Se você quiser explorar como trazer a tabela Códigos de Estado, poderá experimentar. Se não gostar dos resultados, basta excluir essa etapa da lista ETAPAS APLICADAS no painel Configurações de Consulta; e sua consulta retornará ao estado anterior à aplicação dessa etapa Expandir. Você pode fazer isso quantas vezes quiser, até que o processo de expansão tenha a aparência desejada.

    Agora temos uma única consulta (tabela) que combina duas fontes de dados, cada uma delas formatada de acordo com nossas necessidades. Essa consulta pode ser uma base para conexões de dados interessantes, como estatísticas de custo de habitação, qualidade de vida ou taxa de criminalidade em qualquer estado.

  7. Para aplicar as alterações e fechar o Editor do Power Query, selecione Fechar e Aplicar na guia de faixa de opções Página Inicial.

    O modelo semântico transformado aparece no Power BI Desktop, pronto para ser usado para criar relatórios.

    Screenshot of Power Query Editor's Close & Apply button.

Para obter mais informações sobre o Power BI Desktop e as funcionalidades dele, confira os seguintes recursos: