Tutorial: Formatar e combinar dados no Power BI Desktop

Com o Power BI Desktop, você pode se conectar a muitos tipos diferentes de fontes de dados e, em seguida, moldar os dados para atender às suas necessidades, permitindo que você crie relatórios visuais para compartilhar com outras pessoas. Moldar dados significa transformá-los: renomear colunas ou tabelas, alterar texto para números, remover linhas, definir a primeira linha como cabeçalhos e assim por diante. Combinar dados significa conectar-se a duas ou mais fontes de dados, moldá-las conforme necessário e, em seguida, consolidá-las em uma única consulta.

Neste tutorial, irá aprender a:

  • Formate dados usando o Power Query Editor.
  • Conecte-se a diferentes fontes de dados.
  • Combine essas fontes de dados e crie um modelo de dados para usar em relatórios.

Este tutorial demonstra como moldar uma consulta usando o Power BI Desktop, destacando as tarefas mais comuns. A consulta usada aqui é descrita com mais detalhes, incluindo como criar a consulta do zero, em Introdução ao Power BI Desktop.

O Editor do Power Query no Power BI Desktop utiliza os menus do botão direito do rato e o friso Transformar . A maior parte do que você pode selecionar na faixa de opções também está disponível clicando com o botão direito do mouse em um item, como uma coluna, e escolhendo no menu exibido.

Formatar dados

Para formatar dados no Power Query Editor, forneça instruções passo a passo para que o Power Query Editor ajuste os dados à medida que carrega e apresenta os dados. A fonte de dados original não é afetada; Apenas esta vista específica dos dados é ajustada ou moldada.

As etapas especificadas (como renomear uma tabela, transformar um tipo de dados ou excluir uma coluna) são registradas pelo Editor do Power Query. Sempre que esta consulta se liga à origem de dados, o Power Query Editor executa estes passos para que os dados sejam sempre moldados da forma que especificar. Esse processo ocorre sempre que você usa o Editor do Power Query ou para qualquer pessoa que use sua consulta compartilhada, como no serviço do Power BI. Essas etapas são capturadas, sequencialmente, no painel Configurações de Consulta, em ETAPAS APLICADAS. Vamos passar por cada uma dessas etapas neste artigo.

Screenshot of Power Query Editor with the Query Settings pane and Applied steps list.

  1. Importe os dados de uma fonte da Web. Selecione a lista suspensa Obter dados e, em seguida, escolha Web.

    Screenshot of Power Query Editor with the Get data menu and Web source selected.

  2. Cole este URL na caixa de diálogo Da Web e selecione OK.

    https://www.fool.com/research/best-states-to-retire
    

    Screenshot of Power Query Editor's From Web dialog with the source page's URL entered.

  3. Na caixa de diálogo Navegador, selecione Table 1e, em seguida, escolha Transformar dados.

    Screenshot of Power Query Editor's Navigator dialog with HTML Table 1 selected and the Transform Data button highlighted.

Gorjeta

Algumas informações nas tabelas do URL anterior podem ser alteradas ou atualizadas ocasionalmente. Como resultado, talvez seja necessário ajustar as seleções ou etapas neste artigo de acordo.

  1. A janela do Power Query Editor é aberta. Você pode ver as etapas padrão aplicadas até agora, no painel Configurações de Consulta em ETAPAS APLICADAS.

    • Fonte: Ligação ao sítio Web.
    • Tabela extraída de Html: Selecionando a tabela.
    • Cabeçalhos promovidos: alterar a linha superior de dados em cabeçalhos de coluna.
    • Tipo alterado: alterando os tipos de coluna, que são importados como texto, para seus tipos inferidos.

    Screenshot of the Power Query Editor window with Query Settings highlighted.

  2. Altere o nome da tabela do padrão Table 1 para Retirement Datae pressione Enter.

    Screenshot of Power Query Editor showing how to edit a table name in Query Settings.

  3. Os dados existentes são ordenados por uma pontuação ponderada, conforme descrito na página web de origem em Metodologia. Vamos adicionar uma coluna personalizada para calcular uma pontuação diferente. Em seguida, classificaremos a tabela nesta coluna para comparar a classificação da pontuação personalizada com a Classificação existente.

  4. Na faixa de opções Adicionar Coluna, selecione Coluna Personalizada.

    Screenshot of Power Query Editor's Add Column ribbon with the Custom Column button highlighted.

  5. Na caixa de diálogo Coluna Personalizada, em Novo nome da coluna, insira Nova pontuação. Para a fórmula Coluna personalizada, insira os seguintes dados:

    ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] + [Weather] ) / 8
    
  6. Verifique se a mensagem de status é Nenhum erro de sintaxe foi detetado e selecione OK.

    Screenshot of Power Query Editor's Custom Column dialog showing the new column name, custom column formula, and no syntax errors.

  7. Em Configurações de Consulta, a lista ETAPAS APLICADAS agora mostra a nova etapa Personalizada Adicionada que acabamos de definir.

    Screenshot of Power Query Editor's Query Settings pane showing the Applied Steps list with the actions so far.

Ajustar os dados

Antes de trabalharmos com essa consulta, vamos fazer algumas alterações para ajustar seus dados:

  • Ajuste as classificações removendo uma coluna.

    Por exemplo, suponha que o tempo não é um fator em nossos resultados. A remoção desta coluna da consulta não afeta os outros dados.

  • Corrija quaisquer erros.

    Como removemos uma coluna, precisamos ajustar nossos cálculos na coluna Nova pontuação alterando sua fórmula.

  • Ordene os dados.

    Classifique os dados com base na coluna Nova pontuação e compare com a coluna Classificação existente.

  • Substitua os dados.

    Destacaremos como substituir um valor específico e como inserir uma etapa aplicada.

Essas alterações são descritas nas etapas a seguir.

  1. Para remover a coluna Meteorologia, selecione-a, escolha o separador Base no friso e, em seguida, selecione Remover Colunas.

    Screenshot of Power Query Editor's Home menu with the Remove Columns button highlighted.

    Nota

    Os valores da pontuação Nova não foram alterados, devido à ordenação das etapas. O Power Query Editor regista os passos sequencialmente, mas de forma independente, uns dos outros. Para aplicar ações em uma sequência diferente, você pode mover cada etapa aplicada para cima ou para baixo.

  2. Clique com o botão direito do mouse em uma etapa para ver seu menu de contexto.

    Screenshot of Power Query Editor's Applied Steps context menu.

  3. Mova para cima a última etapa, Colunas removidas, para logo acima da etapa Personalizado adicionado.

    Screenshot of Power Query Editor's Applied Steps list with the Removed Columns step now moved above the Custom Column step.

  4. Selecione a etapa Personalizado adicionado.

    Observe que a coluna Nova pontuação agora mostra Erro em vez do valor calculado.

    Screenshot of Power Query Editor and the New score column containing Error values.

    Há várias maneiras de obter mais informações sobre cada erro. Se selecionar a célula sem clicar na palavra Erro, o Editor do Power Query apresenta as informações de erro.

    Screenshot of Power Query Editor showing the New score column with Error details.

    Se selecionar a palavra Erro diretamente, o Editor do Power Query cria um Passo Aplicado no painel Definições de Consulta e apresenta informações sobre o erro. Como não precisamos exibir informações de erro em nenhum outro lugar, selecione Cancelar.

  5. Para corrigir os erros, são necessárias duas alterações, removendo o nome da coluna Tempo e alterando o divisor de 8 para 7. Você pode fazer essas alterações de duas maneiras:

    1. Clique com o botão direito do mouse na etapa Coluna personalizada e selecione Editar configurações. Isso exibe a caixa de diálogo Coluna personalizada usada para criar a coluna Nova pontuação. Edite a fórmula conforme descrito anteriormente, até que tenha esta aparência:

      Screenshot of Power Query Editor's Custom Column dialog with formula errors fixed.

    2. Selecione a coluna Nova pontuação e, em seguida, exiba a fórmula de dados da coluna ativando a caixa de seleção Barra de Fórmulas na guia Exibir.

      Screenshot of Power Query Editor showing the New score column and its data formula with errors fixed.

      Edite a fórmula como descrito anteriormente, até que tenha esta aparência, em seguida, prima Enter.

      = Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)              
      

    O Editor do Power Query substitui os dados pelos valores revistos e o passo Personalizado Adicionado é concluído sem erros.

    Nota

    Você também pode selecionar Remover Erros usando a faixa de opções ou o menu do botão direito do mouse, que remove todas as linhas com erros. No entanto, neste tutorial queremos preservar todos os dados na tabela.

  6. Classifique os dados com base na coluna Nova pontuação . Primeiro, selecione a última etapa aplicada, Adicionado personalizado para exibir os dados mais recentes. Em seguida, selecione a lista suspensa localizada ao lado do cabeçalho da coluna Nova pontuação e escolha Classificar decrescente.

    Screenshot of Power Query Editor showing the New score column with Sort Descending highlighted.

    Os dados estão agora ordenados de acordo com a nova pontuação. Você pode selecionar uma etapa aplicada em qualquer lugar da lista e continuar moldando os dados nesse ponto da sequência. O Editor do Power Query insere automaticamente uma nova etapa diretamente após a etapa aplicada atualmente selecionada.

  7. Em ETAPAS APLICADAS, selecione a etapa que precede a coluna personalizada, que é a etapa Colunas removidas. Aqui vamos substituir o valor do ranking de custo de habitação em Oregon. Clique com o botão direito do mouse na célula apropriada que contém o valor de custo de Moradia do Oregon e selecione Substituir Valores. Observe qual Etapa Aplicada está selecionada no momento.

    Screenshot of the Power Query Editor window showing the Housing cost column with the Replace Values right-click menu item highlighted.

  8. Selecione Inserir.

    Como estamos inserindo uma etapa, o Power Query Editor nos lembra que as etapas subsequentes podem fazer com que a consulta seja interrompida.

    Screenshot of Power Query Editor's Insert Step verification dialog.

  9. Altere o valor de dados para 100.0.

    O Power Query Editor substitui os dados do Oregon. Quando cria um novo passo aplicado, o Power Query Editor atribui-lhe um nome com base na ação, neste caso, Valor Substituído. Se tiver mais do que um passo com o mesmo nome na sua consulta, o Power Query Editor acrescenta um número crescente ao nome de cada passo aplicado subsequente.

  10. Selecione a última etapa aplicada, Linhas classificadas.

    Observe que os dados mudaram em relação ao novo ranking do Oregon. Essa alteração ocorre porque inserimos a etapa Valor substituído no local correto, antes da etapa Personalizado adicionado.

    Agora moldamos nossos dados na medida do necessário. Em seguida, vamos nos conectar a outra fonte de dados e combinar dados.

Combinar dados

Os dados sobre vários estados são interessantes e serão úteis para construir mais esforços de análise e consultas. No entanto, a maioria dos dados sobre estados usa uma abreviação de duas letras para códigos de estado, não o nome completo do estado. Precisamos de uma forma de associar nomes de estados às suas abreviaturas.

Há outra fonte de dados pública que fornece essa associação, mas ela precisa de uma boa quantidade de modelagem antes que possamos conectá-la à nossa tabela de aposentadoria. Para formatar os dados, siga estes passos:

  1. Na faixa de opções Página Inicial no Editor do Power Query, selecione Nova Web de Origem>.

  2. Introduza o endereço do Web site para abreviaturas de estados e, em seguida, https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviationsselecione Ligar.

    O Navigator apresenta o conteúdo do sítio Web.

    Screenshot of Power Query Editor's Navigator page showing the Codes and abbreviations table selected.

  3. Selecione Códigos e abreviaturas para estados, distrito federal, territórios e outras regiões dos EUA.

    Gorjeta

    Será preciso um pouco de modelagem para reduzir os dados desta tabela ao que queremos. Existe uma maneira mais rápida ou fácil de realizar as etapas a seguir? Sim, poderíamos criar uma relação entre as duas tabelas e moldar os dados com base nessa relação. As etapas de exemplo a seguir são úteis para aprender a trabalhar com tabelas. No entanto, os relacionamentos podem ajudá-lo a usar rapidamente os dados de várias tabelas.

Para colocar os dados em forma, siga estas etapas:

  1. Remova a linha superior. Porque é um resultado da forma como a tabela da página web foi criada, não precisamos dela. Na faixa de opções Página Inicial, selecione Remover Linhas Remover Linhas Superiores.>

    Screenshot of Power Query Editor highlighting the Remove Rows dropdown and the Remove Top Rows item.

    A caixa de diálogo Remover Linhas Superiores é exibida. Especifique 1 linha a ser removida.

  2. Promova a nova linha superior para cabeçalhos com Usar Primeira Linha Como Cabeçalhos na guia Página Inicial ou na guia Transformar na faixa de opções.

  3. Como a tabela Dados de Aposentadoria não tem informações para Washington DC ou territórios, precisamos filtrá-los de nossa lista. Selecione a lista suspensa Nome e status da coluna region_1 e desmarque todas as caixas de seleção, exceto Estado.

    Screenshot of Power Query Editor showing a column filter with only the State value selected.

  4. Remova todas as colunas desnecessárias. Como precisamos apenas do mapeamento de cada estado para sua abreviatura oficial de duas letras (nome e status da região e colunas ANSI ), podemos remover as outras colunas. Primeiro, selecione a coluna Nome e status da região, mantenha pressionada a tecla CTRL e selecione a coluna ANSI. Na guia Página Inicial da faixa de opções, selecione Remover Colunas > Remover Outras Colunas.

    Screenshot of Power Query Editor highlighting the Remove Columns dropdown and the Remove Other Columns item.

    Nota

    A sequência de passos aplicados no Power Query Editor é importante e afeta a forma como os dados são moldados. Também é importante considerar como uma etapa pode afetar outra etapa subsequente. Por exemplo, se você remover uma etapa das etapas aplicadas, as etapas subsequentes podem não se comportar como originalmente pretendido.

    Nota

    Quando redimensiona a janela do Editor do Power Query para reduzir a largura, alguns itens do friso são condensados para tirar o melhor partido do espaço visível. Quando aumenta a largura da janela do Editor do Power Query, os itens do friso expandem-se para tirar o máximo partido da área de friso aumentada.

  5. Renomeie as colunas e a tabela. Há algumas maneiras de renomear uma coluna: primeiro selecione a coluna e, em seguida, selecione Renomear na guia Transformar na faixa de opções ou clique com o botão direito do mouse e selecione Renomear. A imagem a seguir mostra as duas opções, mas você só precisa escolher uma.

    Screenshot of Power Query Editor highlighting the Rename button and also the Rename right-click item.

  6. Renomeie as colunas para Nome do Estado e Código do Estado. Para renomear a tabela, insira os Códigos de Estado do Nomeno painel Configurações de Consulta.

    Screenshot of Power Query Editor window showing the results of shaping state codes source data into a table.

Combinar consultas

Agora que moldamos a tabela de Códigos de Estado da maneira que queremos, vamos combinar essas duas tabelas, ou consultas, em uma. Como as tabelas que temos agora são resultado das consultas que aplicamos aos dados, elas geralmente são chamadas de consultas.

Existem duas formas principais de combinar consultas: intercalação e acréscimo.

  • Para uma ou mais colunas que você gostaria de adicionar a outra consulta, mescle as consultas.
  • Para uma ou mais linhas de dados que você gostaria de adicionar a uma consulta existente, você acrescenta a consulta.

Neste caso, queremos mesclar as consultas:

  1. No painel esquerdo do Power Query Editor, selecione a consulta na qual pretende que a outra consulta seja fundida. Neste caso, são Dados de Aposentadoria.

  2. Selecione Mesclar consultas Mesclar consultas > na guia Página Inicial da faixa de opções.

    Screenshot of Power Query Editor's Merge Queries dropdown with the Merge Queries item highlighted.

    Poderá ser-lhe pedido que defina os níveis de privacidade para garantir que os dados são combinados sem incluir ou transferir dados que não pretende transferir.

    A janela Mesclar é exibida. Ele solicita que você selecione qual tabela você deseja mesclar na tabela selecionada e as colunas correspondentes a serem usadas para a mesclagem.

  3. Selecione Estado na tabela Dados de Aposentadoria e, em seguida, selecione a consulta Códigos de Estado.

    Quando você seleciona uma coluna correspondente, o botão OK é ativado.

    Screenshot of Power Query Editor's Merge dialog.

  4. Selecione OK.

    O Editor do Power Query cria uma nova coluna no final da consulta, que contém o conteúdo da tabela (consulta) que foi mesclada com a consulta existente. Todas as colunas da consulta mesclada são condensadas na coluna, mas você pode Expandir a tabela e incluir as colunas desejadas.

  5. Para expandir a tabela mesclada e selecionar quais colunas incluir, selecione o ícone de expansão ( ).

    É apresentada a janela Expandir.

    Screenshot of Power Query Editor's column Expand dialog showing the State Code column highlighted.

  6. Neste caso, queremos apenas a coluna Código do Estado. Selecione essa coluna, desmarque Usar nome da coluna original como prefixo e selecione OK.

    Se tivéssemos deixado a caixa de seleção selecionada para Usar nome da coluna original como prefixo, a coluna mesclada seria denominada Código de Estado.Código de Estado.

    Nota

    Se você quiser explorar como trazer a tabela State Codes , você pode experimentar um pouco. Se você não gostar dos resultados, basta excluir essa etapa da lista ETAPAS APLICADAS no painel Configurações de Consulta e sua consulta retornará ao estado anterior à aplicação da etapa Expandir. Você pode fazer isso quantas vezes quiser até que o processo de expansão fique do jeito que você quiser.

    Agora temos uma única consulta (tabela) que combina duas fontes de dados, cada uma das quais foi moldada para atender às nossas necessidades. Essa consulta pode ser uma base para conexões de dados interessantes, como estatísticas de custo de moradia, qualidade de vida ou taxa de criminalidade em qualquer estado.

  7. Para aplicar as alterações e fechar o Power Query Editor, selecione Fechar & Aplicar no separador Base do friso.

    O modelo semântico transformado aparece no Power BI Desktop, pronto para ser usado para criar relatórios.

    Screenshot of Power Query Editor's Close & Apply button.

Para obter mais informações sobre o Power BI Desktop e seus recursos, consulte os seguintes recursos: