Självstudie: Forma och kombinera data i Power BI Desktop

Med Power BI Desktop kan du ansluta till många olika typer av datakällor och sedan forma data efter dina behov, så att du kan skapa visuella rapporter som du kan dela med andra. Att forma data innebär att transformera data: byta namn på kolumner eller tabeller, ändra text till tal, ta bort rader, ange den första raden som rubriker och så vidare. Att kombinera data innebär att ansluta till två eller flera datakällor, forma dem efter behov och sedan konsolidera dem till en enda fråga.

I den här självstudien får du lära dig att:

  • Forma data med hjälp av Power Query-redigeraren.
  • Anslut till olika datakällor.
  • Kombinera dessa datakällor och skapa en datamodell som ska användas i rapporter.

Den här självstudien visar hur du formar en fråga med hjälp av Power BI Desktop och markerar de vanligaste uppgifterna. Frågan som används här beskrivs mer detaljerat, inklusive hur du skapar frågan från grunden, i Komma igång med Power BI Desktop.

Power Query-redigeraren i Power BI Desktop använder högerklicksmenyerna och Transformera menyfliksområdet. Det mesta du kan välja i menyfliksområdet är också tillgängligt genom att högerklicka på ett objekt, till exempel en kolumn, och välja från menyn som visas.

Forma data

Om du vill forma data i Power Query-redigeraren anger du stegvisa instruktioner för Power Query-redigeraren för att justera data när de läses in och visar data. Den ursprungliga datakällan påverkas inte. endast den här specifika vyn av data justeras eller formas.

De steg du anger (till exempel byta namn på en tabell, transformera en datatyp eller ta bort en kolumn) registreras av Power Query-redigeraren. Varje gång den här frågan ansluter till datakällan utför Power Query-redigeraren dessa steg så att data alltid formas som du anger. Den här processen inträffar när du använder Power Query-redigeraren eller för alla som använder din delade fråga, till exempel på Power BI-tjänst. Dessa steg samlas in sekventiellt i fönstret Fråga Inställningar under TILLÄMPADE STEG. Vi går igenom vart och ett av dessa steg i den här artikeln.

Screenshot of Power Query Editor with the Query Settings pane and Applied steps list.

  1. Importera data från en webbkälla. Välj listrutan Hämta data och välj sedan Webb.

    Screenshot of Power Query Editor with the Get data menu and Web source selected.

  2. Klistra in den här URL:en i dialogrutan Från webben och välj OK.

    https://www.fool.com/research/best-states-to-retire
    

    Screenshot of Power Query Editor's From Web dialog with the source page's URL entered.

  3. I dialogrutan Navigatör väljer du Table 1och väljer sedan Transformera data.

    Screenshot of Power Query Editor's Navigator dialog with HTML Table 1 selected and the Transform Data button highlighted.

Dricks

Viss information i tabellerna från den tidigare URL:en kan ändras eller uppdateras ibland. Därför kan du behöva justera valen eller stegen i den här artikeln i enlighet med detta.

  1. Fönstret Power Query-redigeraren öppnas. Du kan se standardstegen som tillämpats hittills i fönstret Fråga Inställningar under TILLÄMPADE STEG.

    • Källa: Anslut till webbplatsen.
    • Extraherad tabell från Html: Välj tabellen.
    • Upphöjda rubriker: Ändra den översta raden med data till kolumnrubriker.
    • Ändrad typ: Ändra kolumntyperna, som importeras som text, till deras härledda typer.

    Screenshot of the Power Query Editor window with Query Settings highlighted.

  2. Ändra tabellnamnet från standardvärdet Table 1 till Retirement Dataoch tryck sedan på Retur.

    Screenshot of Power Query Editor showing how to edit a table name in Query Settings.

  3. Befintliga data sorteras efter en viktad poäng enligt beskrivningen på källwebbsidan under Metodik. Nu ska vi lägga till en anpassad kolumn för att beräkna en annan poäng. Sedan sorterar vi tabellen i den här kolumnen för att jämföra den anpassade poängens rangordning med den befintliga rankningen.

  4. I menyfliksområdet Lägg till kolumn väljer du Anpassad kolumn.

    Screenshot of Power Query Editor's Add Column ribbon with the Custom Column button highlighted.

  5. I dialogrutan Anpassad kolumn i Nytt kolumnnamn anger du Ny poäng. För formeln Anpassad kolumn anger du följande data:

    ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] + [Weather] ) / 8
    
  6. Kontrollera att statusmeddelandet är Inga syntaxfel har identifierats och välj OK.

    Screenshot of Power Query Editor's Custom Column dialog showing the new column name, custom column formula, and no syntax errors.

  7. I Fråga Inställningar visar listan TILLÄMPADE STEG nu det nya tillagda anpassade steget som vi precis har definierat.

    Screenshot of Power Query Editor's Query Settings pane showing the Applied Steps list with the actions so far.

Justera data

Innan vi arbetar med den här frågan ska vi göra några ändringar för att justera dess data:

  • Justera rangordningen genom att ta bort en kolumn.

    Anta till exempel att Väder inte är en faktor i våra resultat. Om du tar bort den här kolumnen från frågan påverkas inte andra data.

  • Åtgärda eventuella fel.

    Eftersom vi har tagit bort en kolumn måste vi justera våra beräkningar i kolumnen Ny poäng genom att ändra dess formel.

  • Sortera data.

    Sortera data baserat på kolumnen Ny poäng och jämför med den befintliga rankningskolumnen .

  • Ersätt data.

    Vi belyser hur du ersätter ett visst värde och hur du infogar ett tillämpat steg.

Dessa ändringar beskrivs i följande steg.

  1. Om du vill ta bort kolumnen Väder väljer du kolumnen, väljer fliken Start i menyfliksområdet och väljer sedan Ta bort kolumner.

    Screenshot of Power Query Editor's Home menu with the Remove Columns button highlighted.

    Kommentar

    De nya poängvärdena har inte ändrats på grund av stegens ordning. Power Query-redigeraren registrerar stegen sekventiellt, men oberoende av varandra. Om du vill tillämpa åtgärder i en annan sekvens kan du flytta varje tillämpat steg uppåt eller nedåt.

  2. Högerklicka på ett steg för att se snabbmenyn.

    Screenshot of Power Query Editor's Applied Steps context menu.

  3. Flytta upp det sista steget, Borttagna kolumner, till precis ovanför steget Lägg till anpassad .

    Screenshot of Power Query Editor's Applied Steps list with the Removed Columns step now moved above the Custom Column step.

  4. Välj steget Lägg till anpassad .

    Observera att kolumnen Ny poäng nu visar Fel i stället för det beräknade värdet.

    Screenshot of Power Query Editor and the New score column containing Error values.

    Det finns flera sätt att få mer information om varje fel. Om du markerar cellen utan att klicka på ordet Fel Power Query-redigeraren visar felinformationen.

    Screenshot of Power Query Editor showing the New score column with Error details.

    Om du väljer ordet Fel direkt skapar Power Query-redigeraren ett tillämpat steg i fönstret Fråga Inställningar och visar information om felet. Eftersom vi inte behöver visa felinformation någon annanstans väljer du Avbryt.

  5. För att åtgärda felen krävs två ändringar, vilket tar bort kolumnnamnet Väder och ändrar divisorn från 8 till 7. Du kan göra dessa ändringar på två sätt:

    1. Högerklicka på steget Anpassad kolumn och välj Redigera Inställningar. Då visas dialogrutan Anpassad kolumn som du använde för att skapa kolumnen Ny poäng. Redigera formeln enligt beskrivningen tidigare tills den ser ut så här:

      Screenshot of Power Query Editor's Custom Column dialog with formula errors fixed.

    2. Välj kolumnen Ny poäng och visa sedan kolumnens dataformel genom att aktivera kryssrutan Formelfältfliken Visa.

      Screenshot of Power Query Editor showing the New score column and its data formula with errors fixed.

      Redigera formeln enligt beskrivningen tidigare tills den ser ut så här och tryck sedan på Retur.

      = Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)              
      

    Power Query-redigeraren ersätter data med de ändrade värdena och Det anpassade steget har lagts till slutförs utan fel.

    Kommentar

    Du kan också välja Ta bort fel genom att använda menyfliksområdet eller högerklicksmenyn, som tar bort alla rader som har fel. I den här självstudien vill vi dock bevara alla data i tabellen.

  6. Sortera data baserat på kolumnen Ny poäng . Välj först det senast tillämpade steget, Lade till anpassad för att visa de senaste data. Välj sedan listrutan bredvid kolumnrubriken Ny poäng och välj Sortera fallande.

    Screenshot of Power Query Editor showing the New score column with Sort Descending highlighted.

    Data sorteras nu enligt Ny poäng. Du kan välja ett tillämpat steg var som helst i listan och fortsätta att forma data vid den tidpunkten i sekvensen. Power Query-redigeraren infogar automatiskt ett nytt steg direkt efter det markerade tillämpade steget.

  7. I TILLÄMPADE STEG väljer du steget före den anpassade kolumnen, som är steget Borttagna kolumner . Här ersätter vi värdet för rangordningen för bostadskostnader i Oregon. Högerklicka på lämplig cell som innehåller Oregons bostadskostnadsvärde och välj sedan Ersätt värden. Observera vilket tillämpat steg som är markerat för närvarande.

    Screenshot of the Power Query Editor window showing the Housing cost column with the Replace Values right-click menu item highlighted.

  8. Välj Infoga.

    Eftersom vi infogar ett steg påminner Power Query-redigeraren oss om att efterföljande steg kan leda till att frågan bryts.

    Screenshot of Power Query Editor's Insert Step verification dialog.

  9. Ändra datavärdet till 100,0.

    Power Query-redigeraren ersätter data för Oregon. När du skapar ett nytt tillämpat steg Power Query-redigeraren namnger det baserat på åtgärden, i det här fallet Ersatt värde. Om du har fler än ett steg med samma namn i frågan lägger Power Query-redigeraren till ett ökande antal till varje efterföljande tillämpat stegs namn.

  10. Välj det senaste tillämpade steget, Sorterade rader.

    Observera att data har ändrats när det gäller Oregons nya rankning. Den här ändringen beror på att vi infogade steget Ersatt värde på rätt plats, före steget Lägg till anpassad .

    Vi har nu format våra data i den utsträckning vi behöver. Nu ska vi ansluta till en annan datakälla och kombinera data.

Kombinera data

Data om olika tillstånd är intressanta och kommer att vara användbara för att skapa ytterligare analysinsatser och frågor. De flesta data om tillstånd använder dock en förkortning med två bokstäver för tillståndskoder, inte tillståndets fullständiga namn. Vi behöver ett sätt att associera tillståndsnamn med deras förkortningar.

Det finns en annan offentlig datakälla som tillhandahåller den associationen, men den behöver en hel del formning innan vi kan ansluta den till vår pensionstabell. Så här formar du data:

  1. I menyfliksområdet Start i Power Query-redigeraren väljer du Ny källwebb>.

  2. Ange adressen till webbplatsen för tillståndsförkortningar och https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviationsvälj sedan Anslut.

    Navigatören visar innehållet på webbplatsen.

    Screenshot of Power Query Editor's Navigator page showing the Codes and abbreviations table selected.

  3. Välj Koder och förkortningar för amerikanska delstater, federala distrikt, territorier och andra regioner.

    Dricks

    Det krävs lite formning för att parera tabellens data till det vi vill ha. Finns det ett snabbare eller enklare sätt att utföra följande steg? Ja, vi kan skapa en relation mellan de två tabellerna och forma data baserat på den relationen. Följande exempelsteg är användbara för att lära dig hur du arbetar med tabeller. Relationer kan dock hjälpa dig att snabbt använda data från flera tabeller.

Följ dessa steg för att få data i form:

  1. Ta bort den översta raden. Eftersom det är ett resultat av hur webbsidans tabell skapades behöver vi den inte. I menyfliksområdet Start väljer du Ta bort rader > Ta bort de översta raderna.

    Screenshot of Power Query Editor highlighting the Remove Rows dropdown and the Remove Top Rows item.

    Dialogrutan Ta bort de översta raderna visas. Ange 1 rad att ta bort.

  2. Höj upp den nya översta raden till rubriker med Använd första raden som rubriker från fliken Start eller från fliken Transformera i menyfliksområdet.

  3. Eftersom tabellen Pensionsdata inte har information för Washington DC eller territorier måste vi filtrera dem från vår lista. Markera listrutan Namn och status för region_1 kolumn och avmarkera sedan alla kryssrutor utom Tillstånd.

    Screenshot of Power Query Editor showing a column filter with only the State value selected.

  4. Ta bort alla kolumner som inte behövs. Eftersom vi bara behöver mappningen av varje tillstånd till dess officiella förkortning med två bokstäver (namn och status för region - och ANSI-kolumner ) kan vi ta bort de andra kolumnerna. Välj först kolumnen Namn och status för region, håll sedan ned CTRL-tangenten och välj kolumnen ANSI. På fliken Start i menyfliksområdet väljer du Ta bort kolumner > Ta bort andra kolumner.

    Screenshot of Power Query Editor highlighting the Remove Columns dropdown and the Remove Other Columns item.

    Kommentar

    Sekvensen med tillämpade steg i Power Query-redigeraren är viktig och påverkar hur data formas. Det är också viktigt att tänka på hur ett steg kan påverka ett annat efterföljande steg. Om du till exempel tar bort ett steg från de tillämpade stegen kanske efterföljande steg inte fungerar som de ursprungligen var tänkta.

    Kommentar

    När du ändrar storlek på det Power Query-redigeraren fönstret så att bredden blir mindre, komprimeras vissa menyfliksobjekt så att du får bästa möjliga användning av synligt utrymme. När du ökar bredden på det Power Query-redigeraren fönstret expanderar menyfliksområdet så att du får ut mesta möjliga av det ökade menyfliksområdet.

  5. Byt namn på kolumnerna och tabellen. Det finns några sätt att byta namn på en kolumn: Välj först kolumnen och välj sedan Byt namn på fliken Transformera i menyfliksområdet eller högerklicka och välj Byt namn. Följande bild visar båda alternativen, men du behöver bara välja ett.

    Screenshot of Power Query Editor highlighting the Rename button and also the Rename right-click item.

  6. Byt namn på kolumnerna till Tillståndsnamn och Delstatskod. Om du vill byta namn på tabellen anger du Namntillståndskoder i fönstret Fråga Inställningar.

    Screenshot of Power Query Editor window showing the results of shaping state codes source data into a table.

Kombinera frågor

Nu när vi har format tabellen Tillståndskoder som vi vill ska vi kombinera dessa två tabeller eller frågor till en. Eftersom de tabeller vi nu har är ett resultat av de frågor som vi tillämpade på data kallas de ofta frågor.

Det finns två huvudsakliga sätt att kombinera frågor på: slå ihop och lägga till.

  • För en eller flera kolumner som du vill lägga till i en annan fråga sammanfogar du frågorna.
  • För en eller flera rader med data som du vill lägga till i en befintlig fråga lägger du till frågan.

I det här fallet vill vi slå samman frågorna:

  1. I den vänstra rutan i Power Query-redigeraren väljer du den fråga som du vill att den andra frågan ska sammanfogas till. I det här fallet är det Pensionsdata.

  2. Välj Slå samman frågor > Slå samman frågor från fliken Start i menyfliksområdet.

    Screenshot of Power Query Editor's Merge Queries dropdown with the Merge Queries item highlighted.

    Du kan uppmanas att ange sekretessnivåerna för att säkerställa att data kombineras utan att inkludera eller överföra data som du inte vill överföra.

    Fönstret Slå samman visas. Du uppmanas att välja vilken tabell som du vill sammanfoga i den valda tabellen och de matchande kolumner som ska användas för sammanfogningen.

  3. Välj Delstat i tabellen Pensionsdata och välj sedan frågan Delstatskoder .

    När du väljer matchande kolumner aktiveras ok-knappen .

    Screenshot of Power Query Editor's Merge dialog.

  4. Välj OK.

    Power Query-redigeraren skapar en ny kolumn i slutet av frågan, som innehåller innehållet i tabellen (frågan) som sammanfogades med den befintliga frågan. Alla kolumner från den sammanfogade frågan komprimeras till kolumnen, men du kan expandera tabellen och inkludera vilka kolumner du vill.

  5. Om du vill expandera den sammanfogade tabellen och välja vilka kolumner som ska inkluderas väljer du expandera-ikonen ( ).

    Fönstret Expandera visas.

    Screenshot of Power Query Editor's column Expand dialog showing the State Code column highlighted.

  6. I det här fallet vill vi bara ha kolumnen State Code . Välj den kolumnen, avmarkera Använd det ursprungliga kolumnnamnet som prefix och välj sedan OK.

    Om vi hade lämnat kryssrutan markerad för Använd ursprungligt kolumnnamn som prefix, skulle den sammanfogade kolumnen ha namnet State Codes.State Code.

    Kommentar

    Om du vill utforska hur du tar in tabellen Delstatskoder kan du experimentera lite. Om du inte gillar resultatet tar du bara bort det steget från listan TILLÄMPADE STEG i fönstret Fråga Inställningar och frågan återgår till tillståndet innan du tillämpar steget Expandera. Du kan göra detta så många gånger du vill tills expanderingsprocessen ser ut som du vill.

    Nu har vi en enda fråga (tabell) som kombinerar två datakällor, som var och en har utformats för att uppfylla våra behov. Den här frågan kan vara en grund för intressanta dataanslutningar, till exempel statistik över bostadskostnader, livskvalitet eller brottsfrekvens i alla stater.

  7. Om du vill tillämpa ändringarna och stänga Power Query-redigeraren väljer du Stäng och användfliken Start i menyfliksområdet.

    Den transformerade semantiska modellen visas i Power BI Desktop, redo att användas för att skapa rapporter.

    Screenshot of Power Query Editor's Close & Apply button.

Mer information om Power BI Desktop och dess funktioner finns i följande resurser: