Oktatóanyag: Adatok formázása és egyesítése a Power BI Desktopban

A Power BI Desktop segítségével számos különböző típusú adatforráshoz csatlakozhat, majd igényeinek megfelelően alakíthatja az adatokat, így vizuális jelentéseket hozhat létre másokkal való megosztáshoz. Az adatok alakítása az adatok átalakítását jelenti: oszlopok vagy táblázatok átnevezése, szöveg számmá alakítása, sorok eltávolítása, az első sor fejlécként való beállítása stb. Az adatok kombinálása azt jelenti, hogy két vagy több adatforráshoz csatlakozik, szükség szerint alakítja őket, majd egyetlen lekérdezésbe összesíti őket.

Az oktatóanyag segítségével megtanulhatja a következőket:

  • Adatok formázása Power Query-szerkesztő használatával.
  • Csatlakozás különböző adatforrásokhoz.
  • Egyesítse ezeket az adatforrásokat, és hozzon létre egy jelentéshez használható adatmodellt.

Ez az oktatóanyag bemutatja, hogyan alakíthat lekérdezést a Power BI Desktop használatával, kiemelve a leggyakoribb feladatokat. Az itt használt lekérdezést részletesebben ismertetjük, többek között azt is, hogyan hozhatja létre a lekérdezést az alapoktól a Power BI Desktop első lépéseiben.

Power Query-szerkesztő a Power BI Desktopban a jobb gombbal kattintó menüket és a Menüszalag átalakítása. A menüszalagon kiválasztható elemek többsége a jobb gombbal egy elemre( például egy oszlopra) kattintva és a megjelenő menüből való választással is elérhető.

Adatok formázása

Az adatok Power Query-szerkesztő való alakításához részletes útmutatást kell adnia a Power Query-szerkesztő az adatok betöltésekor történő módosításához és az adatok bemutatásához. Az eredeti adatforrásra nincs hatással; csak az adatok ezen nézete van módosítva vagy formázva.

A megadott lépéseket (például tábla átnevezését, adattípus átalakítását vagy oszlop törlését) a Power Query-szerkesztő rögzíti. Minden alkalommal, amikor ez a lekérdezés csatlakozik az adatforráshoz, Power Query-szerkesztő végrehajtja ezeket a lépéseket, hogy az adatok mindig a megadott módon alakuljanak. Ez a folyamat akkor fordul elő, amikor Power Query-szerkesztő használ, vagy ha a megosztott lekérdezést használja, például a Power BI szolgáltatás. Ezek a lépések egymás után lesznek rögzítve a Lekérdezés Gépház panelEN, az ALKALMAZOTT LÉPÉSEK területen. A cikkben szereplő lépések mindegyikét át fogjuk haladni.

Screenshot of Power Query Editor with the Query Settings pane and Applied steps list.

  1. Importálja az adatokat egy webes forrásból. Válassza az Adatok lekérése legördülő menüt, majd a Web lehetőséget.

    Screenshot of Power Query Editor with the Get data menu and Web source selected.

  2. Illessze be ezt az URL-címet a Webről párbeszédpanelre, és válassza az OK gombot.

    https://www.fool.com/research/best-states-to-retire
    

    Screenshot of Power Query Editor's From Web dialog with the source page's URL entered.

  3. A Kezelő párbeszédpanelen válassza az Table 1Adatok átalakítása lehetőséget.

    Screenshot of Power Query Editor's Navigator dialog with HTML Table 1 selected and the Transform Data button highlighted.

Tipp.

Előfordulhat, hogy az előző URL-cím tábláinak bizonyos információi időnként módosulnak vagy frissülnek. Ennek eredményeképpen előfordulhat, hogy ennek megfelelően módosítania kell a cikkben szereplő kijelöléseket vagy lépéseket.

  1. Megnyílik a Power Query-szerkesztő ablak. Az eddig alkalmazott alapértelmezett lépéseket a Lekérdezés Gépház panelEN, az ALKALMAZOTT LÉPÉSEK területen tekintheti meg.

    • Forrás: Csatlakozás a webhelyre.
    • Kinyert táblázat html-ből: A táblázat kijelölése.
    • Előléptetett fejlécek: A felső adatsor oszlopfejlécekké alakítása.
    • Módosított típus: A szövegként importált oszloptípusok módosítása a kikövetkeztetett típusokra.

    Screenshot of the Power Query Editor window with Query Settings highlighted.

  2. Módosítsa a tábla nevét az alapértelmezett Table 1 értékről az Enter billentyűt lenyomvaRetirement Data.

    Screenshot of Power Query Editor showing how to edit a table name in Query Settings.

  3. A meglévő adatok rendezése súlyozott pontszámmal történik, a forrásweblap Módszertan területén leírtak szerint. Adjon hozzá egy egyéni oszlopot egy másik pontszám kiszámításához. Ezután rendezzük a táblázatot ezen az oszlopon, hogy összehasonlítsuk az egyéni pontszám rangsorolását a meglévő rangtal.

  4. Az Oszlop hozzáadása menüszalagon válassza az Egyéni oszlop lehetőséget.

    Screenshot of Power Query Editor's Add Column ribbon with the Custom Column button highlighted.

  5. Az Egyéni oszlop párbeszédpanel Új oszlop nevére írja be az Új pontszámot. Az Egyéni oszlop képletéhez adja meg a következő adatokat:

    ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] + [Weather] ) / 8
    
  6. Győződjön meg arról, hogy az állapotüzenet nem észlelt szintaxishibát, és válassza az OK gombot.

    Screenshot of Power Query Editor's Custom Column dialog showing the new column name, custom column formula, and no syntax errors.

  7. A Lekérdezési Gépház az ALKALMAZOTT LÉPÉSEK listában megjelenik az imént definiált új egyéni hozzáadott lépés.

    Screenshot of Power Query Editor's Query Settings pane showing the Applied Steps list with the actions so far.

Az adatok módosítása

A lekérdezés használata előtt módosítsunk néhány módosítást az adatok módosításához:

  • Állítsa be a rangsorokat egy oszlop eltávolításával.

    Tegyük fel például, hogy az Időjárás nem tényező az eredményünkben. Ha eltávolítja ezt az oszlopot a lekérdezésből, az nem befolyásolja a többi adatot.

  • Javítsa ki a hibákat.

    Mivel eltávolítottunk egy oszlopot, a képlet módosításával módosítani kell a számításokat az Új pontszám oszlopban.

  • Rendezze az adatokat.

    Rendezze az adatokat az Új pontszám oszlop alapján, és hasonlítsa össze a meglévő Rangsor oszlopmal.

  • Cserélje le az adatokat.

    Kiemeljük, hogyan cserélhet le egy adott értéket, és hogyan szúrhat be egy alkalmazott lépést.

Ezeket a módosításokat az alábbi lépések ismertetik.

  1. Az Időjárás oszlop eltávolításához jelölje ki az oszlopot, válassza a Kezdőlap lapot a menüszalagon, majd válassza az Oszlopok eltávolítása lehetőséget.

    Screenshot of Power Query Editor's Home menu with the Remove Columns button highlighted.

    Feljegyzés

    Az új pontszámértékek a lépések sorrendje miatt nem változtak. Power Query-szerkesztő egymás után, de egymástól függetlenül rögzíti a lépéseket. Ha más sorrendben szeretne műveleteket alkalmazni, az egyes alkalmazott lépéseket felfelé vagy lefelé helyezheti.

  2. Kattintson a jobb gombbal egy lépésre a helyi menü megjelenítéséhez.

    Screenshot of Power Query Editor's Applied Steps context menu.

  3. Lépjen fel az utolsó, Eltávolított oszlopok lépésre a Hozzáadott egyéni lépés fölé.

    Screenshot of Power Query Editor's Applied Steps list with the Removed Columns step now moved above the Custom Column step.

  4. Válassza a Hozzáadott egyéni lépés lehetőséget.

    Figyelje meg, hogy az Új pontszám oszlopban a hiba jelenik meg a számított érték helyett.

    Screenshot of Power Query Editor and the New score column containing Error values.

    Az egyes hibákról többféleképpen is tájékozódhat. Ha a hiba szóra kattintás nélkül választja ki a cellát, Power Query-szerkesztő megjeleníti a hibainformációkat.

    Screenshot of Power Query Editor showing the New score column with Error details.

    Ha közvetlenül a Hiba szót választja, Power Query-szerkesztő létrehoz egy alkalmazott lépést a Lekérdezés Gépház panelen, és megjeleníti a hibával kapcsolatos információkat. Mivel nem kell máshol megjeleníteni a hibainformációkat, válassza a Mégse lehetőséget.

  5. A hibák kijavításához két módosításra van szükség: az Időjárás oszlop nevének eltávolítására és az osztó 8-ról 7-esre való módosítására. Ezeket a módosításokat kétféleképpen hajthatja végre:

    1. Kattintson a jobb gombbal az Egyéni oszlop lépésre, és válassza a Szerkesztés Gépház lehetőséget. Ekkor megjelenik az Új pontszám oszlop létrehozásához használt Egyéni oszlop párbeszédpanel. Szerkessze a képletet a korábban leírtak szerint, amíg az így nem néz ki:

      Screenshot of Power Query Editor's Custom Column dialog with formula errors fixed.

    2. Jelölje ki az Új pontszám oszlopot, majd a Nézet lap Szerkesztőléc jelölőnégyzetének engedélyezésével jelenítse meg az oszlop adatképletét.

      Screenshot of Power Query Editor showing the New score column and its data formula with errors fixed.

      Szerkessze a korábban ismertetett képletet, amíg így nem néz ki, majd nyomja le az Enter billentyűt.

      = Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)              
      

    Power Query-szerkesztő lecseréli az adatokat a módosított értékekre és a A hozzáadott egyéni lépés hiba nélkül befejeződik.

    Feljegyzés

    A hibák eltávolítása lehetőséget a menüszalagon vagy a jobb gombbal kattintva is kiválaszthatja, amely eltávolítja a hibákat tartalmazó sorokat. Ebben az oktatóanyagban azonban meg szeretnénk őrizni a tábla összes adatát.

  6. Rendezze az adatokat az Új pontszám oszlop alapján. Először válassza ki az utolsó alkalmazott lépést, a Hozzáadott egyéni beállítást a legutóbbi adatok megjelenítéséhez. Ezután válassza az Új pontszám oszlop fejléce melletti legördülő menüt, és válassza a Csökkenő rendezés lehetőséget.

    Screenshot of Power Query Editor showing the New score column with Sort Descending highlighted.

    Az adatok most az Új pontszám szerint lesznek rendezve. A listában bárhol kijelölhet egy alkalmazott lépést, és folytathatja az adatok formázását a sorrend ezen pontján. Power Query-szerkesztő automatikusan beszúr egy új lépést közvetlenül az aktuálisan kiválasztott alkalmazott lépés után.

  7. Az ALKALMAZOTT LÉPÉSEK területen válassza ki az egyéni oszlopot megelőző lépést, amely az Eltávolított oszlopok lépés. Itt lecseréljük az oregoni lakásköltség-rangsor értékét. Kattintson a jobb gombbal a megfelelő cellára, amely oregoni lakhatási költségértéket tartalmaz, majd válassza az Értékek cseréje lehetőséget. Figyelje meg, hogy melyik alkalmazott lépés van kiválasztva.

    Screenshot of the Power Query Editor window showing the Housing cost column with the Replace Values right-click menu item highlighted.

  8. Válassza a Beszúrás lehetőséget.

    Mivel egy lépést szúrunk be, Power Query-szerkesztő emlékeztet arra, hogy a következő lépések a lekérdezés megszakadását okozhatják.

    Screenshot of Power Query Editor's Insert Step verification dialog.

  9. Módosítsa az adatértéket 100,0-ra.

    Power Query-szerkesztő oregoni adatokat cserél le. Amikor új alkalmazott lépést hoz létre, Power Query-szerkesztő a művelet alapján nevezi el, ebben az esetben az Érték helyett. Ha a lekérdezésben egynél több lépés szerepel ugyanazzal a névvel, Power Query-szerkesztő egyre több lépést fűz hozzá az összes további alkalmazott lépés nevéhez.

  10. Válassza ki az utolsó alkalmazott lépést, rendezett sorokat.

    Figyelje meg, hogy az adatok megváltoztak Oregon új rangsorával kapcsolatban. Ez a változás azért fordul elő, mert a Lecserélt érték lépést a megfelelő helyre szúrtuk be a Hozzáadott egyéni lépés előtt.

    Most már olyan mértékben alakítottuk ki az adatokat, amennyire szükségünk van. Ezután kapcsolódjunk egy másik adatforráshoz, és egyesítsük az adatokat.

Adatok összevonása

A különböző állapotokkal kapcsolatos adatok érdekesek, és hasznosak lesznek további elemzési erőfeszítések és lekérdezések készítéséhez. Az állapotokra vonatkozó adatok többsége azonban az állapotkódok kétbetűs rövidítését használja, nem pedig az állam teljes nevét. Módot kell használnunk az államnevek és a rövidítések társítására.

Van egy másik nyilvános adatforrás, amely biztosítja ezt a társítást, de megfelelő mértékű alakítást igényel, mielőtt csatlakoztathatnánk a nyugdíjazási táblához. Az adatok alakításához kövesse az alábbi lépéseket:

  1. A Power Query-szerkesztő Kezdőlap menüszalagjáról válassza az Új forrásweb >lehetőséget.

  2. Adja meg a webhely címét az állapot rövidítésekhez, https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviationsmajd válassza a Csatlakozás.

    A Kezelő megjeleníti a webhely tartalmát.

    Screenshot of Power Query Editor's Navigator page showing the Codes and abbreviations table selected.

  3. Válassza ki az amerikai államok, szövetségi körzetek, területek és egyéb régiók kódjait és rövidítéseit.

    Tipp.

    Egy kis átalakítást fog igénybe venni, hogy a táblázat adatait a kívánt értékre alakítsuk. Van gyorsabb vagy egyszerűbb módja a következő lépések végrehajtásának? Igen, létrehozhatunk egy kapcsolatot a két tábla között, és ennek alapján alakíthatjuk az adatokat. Az alábbi példalépések hasznosak a táblák használatához. A kapcsolatok azonban segíthetnek a több táblából származó adatok gyors felhasználásában.

Az adatok alakzatba alakításához kövesse az alábbi lépéseket:

  1. Távolítsa el a felső sort. Mivel ez annak az eredménye, ahogyan a weblap táblázata létre lett hozva, nincs rá szükségünk. A Kezdőlap menüszalagon válassza a Sorok > eltávolítása felső sorok eltávolítása lehetőséget.

    Screenshot of Power Query Editor highlighting the Remove Rows dropdown and the Remove Top Rows item.

    Megjelenik a Felső sorok eltávolítása párbeszédpanel. Adjon meg 1 eltávolítandó sort.

  2. Előléptetheti az új felső sort fejlécekké a Kezdőlap lap Első sor használata fejlécként vagy a menüszalag Átalakítás lapján.

  3. Mivel a Nyugdíjazási adatok tábla nem rendelkezik Washington DC-hez vagy területekhez kapcsolódó információkkal, szűrnünk kell őket a listából. Jelölje be region_1 oszlop legördülő menüjének nevét és állapotát, majd törölje az összes jelölőnégyzet jelölését az Állapot kivételével.

    Screenshot of Power Query Editor showing a column filter with only the State value selected.

  4. Távolítsa el az összes szükségtelen oszlopot. Mivel csak az egyes állapotok hivatalos kétbetűs rövidítésére van szükségünk (a régió és az ANSI-oszlopok neve és állapota), eltávolíthatjuk a többi oszlopot. Először válassza ki a Régió oszlop nevét és állapotát, majd tartsa lenyomva a CTRL billentyűt, és válassza ki az ANSI oszlopot. A menüszalag Kezdőlap lapján válassza az Oszlopok > eltávolítása más oszlopok eltávolítása lehetőséget.

    Screenshot of Power Query Editor highlighting the Remove Columns dropdown and the Remove Other Columns item.

    Feljegyzés

    A Power Query-szerkesztő alkalmazott lépéseinek sorrendje fontos, és hatással van az adatok alakításának módjára. Azt is fontos figyelembe venni, hogy az egyik lépés milyen hatással lehet egy újabb lépésre. Ha például eltávolít egy lépést az alkalmazott lépésekből, előfordulhat, hogy a következő lépések nem az eredetileg tervezett módon működnek.

    Feljegyzés

    Amikor átméretezi a Power Query-szerkesztő ablakot, hogy a szélesség kisebb legyen, egyes menüszalagelemeket a rendszer tömörít, hogy a lehető legjobban kihasználhassa a látható területet. Ha növeli a Power Query-szerkesztő ablak szélességét, a menüszalag elemei kinyílnak, hogy a lehető legjobban kihasználják a megnövekedett menüszalagterületet.

  5. Nevezze át az oszlopokat és a táblázatot. Többféleképpen is átnevezhet egy oszlopot: Először jelölje ki az oszlopot, majd válassza az Átnevezés lehetőséget a menüszalag Átalakítás lapján, vagy kattintson a jobb gombbal, és válassza az Átnevezés lehetőséget. Az alábbi képen mindkét lehetőség látható, de csak egyet kell választania.

    Screenshot of Power Query Editor highlighting the Rename button and also the Rename right-click item.

  6. Nevezze át az oszlopokat államnévre és állapotkódra. A tábla átnevezéséhez írja be a Névállapot-kódokat a Lekérdezés Gépház panelen.

    Screenshot of Power Query Editor window showing the results of shaping state codes source data into a table.

Lekérdezések egyesítése

Most, hogy az Állapotkódok táblát a kívánt módon alakítottuk ki, egyesítsük ezt a két táblát vagy lekérdezést egybe. Mivel a most használt táblák az adatokra alkalmazott lekérdezések eredményei, ezeket gyakran lekérdezésnek nevezzük.

A lekérdezések összevonásának két fő módja van: egyesítés és hozzáfűzés.

  • Egy vagy több olyan oszlop esetében, amelyet egy másik lekérdezéshez szeretne hozzáadni, egyesítse a lekérdezéseket.
  • Egy vagy több olyan adatsor esetében, amelyet egy meglévő lekérdezéshez szeretne hozzáadni, fűzze hozzá a lekérdezést.

Ebben az esetben egyesíteni szeretnénk a lekérdezéseket:

  1. A Power Query-szerkesztő bal oldali ablaktábláján válassza ki azt a lekérdezést, amelybe a másik lekérdezést egyesíteni szeretné. Ebben az esetben a nyugdíjazási adatok.

  2. Válassza a Lekérdezések egyesítése lekérdezések > egyesítése lehetőséget a menüszalag Kezdőlap lapján.

    Screenshot of Power Query Editor's Merge Queries dropdown with the Merge Queries item highlighted.

    Előfordulhat, hogy a rendszer kérni fogja az adatvédelmi szintek beállítását, hogy az adatok össze legyenek állítva anélkül, hogy bele kellene vennie vagy át kellene vinnie azokat az adatokat, amelyeket nem szeretne átadni.

    Megjelenik az Egyesítés ablak. Arra kéri, hogy válassza ki, melyik táblát szeretné egyesíteni a kijelölt táblával, valamint az egyesítéshez használni kívánt megfelelő oszlopokat.

  3. Válassza ki az Állapot elemet a Kivonási adatok táblából, majd válassza ki az Állapotkódok lekérdezést.

    Ha kiválaszt egy megfelelő oszlopot, az OK gomb engedélyezve lesz.

    Screenshot of Power Query Editor's Merge dialog.

  4. Kattintson az OK gombra.

    Power Query-szerkesztő létrehoz egy új oszlopot a lekérdezés végén, amely a meglévő lekérdezéssel egyesített tábla (lekérdezés) tartalmát tartalmazza. Az egyesített lekérdezés összes oszlopa az oszlopba van tömörítve, de kibonthatja a táblát, és belefoglalhatja a kívánt oszlopokat.

  5. Az egyesített tábla kibontásához és a belefoglalandó oszlopok kiválasztásához válassza a kibontás ikont ( ).

    Ekkor megjelenik a Kibontás ablak.

    Screenshot of Power Query Editor's column Expand dialog showing the State Code column highlighted.

  6. Ebben az esetben csak az Állapotkód oszlopot szeretnénk. Jelölje ki az oszlopot, törölje az Eredeti oszlopnév használata előtagként jelölőnégyzet jelölését, majd kattintson az OK gombra.

    Ha az Eredeti oszlopnév használata előtagként jelölőnégyzetet bejelöltük volna, az egyesített oszlop neve State Codes.State Code lesz.

    Feljegyzés

    Ha szeretné megtudni, hogyan helyezheti be az Állapotkódok táblát, kísérletezhet egy kicsit. Ha nem tetszik az eredmény, törölje ezt a lépést a Lekérdezés Gépház panel ALKALMAZOTT LÉPÉSEK listájából, és a lekérdezés a Kibontási lépés alkalmazása előtt visszatér az állapothoz. Ezt annyiszor teheti meg, amennyit csak szeretne, amíg a kibontott folyamat a kívánt módon nem jelenik meg.

    Most már egyetlen lekérdezéssel (táblázat) rendelkezünk, amely két adatforrást egyesít, amelyek mindegyike az igényeinknek megfelelően lett kialakítva. Ez a lekérdezés érdekes adatkapcsolatok alapja lehet, például a lakásköltség-statisztikák, az életminőség vagy a bűnözési arány bármilyen állapotban.

  7. A módosítások alkalmazásához és a Power Query-szerkesztő bezárásához válassza a Kezdőlap menüszalagjának Bezárás & Alkalmaz gombját.

    Az átalakított szemantikai modell megjelenik a Power BI Desktopban, amely készen áll a jelentések létrehozására.

    Screenshot of Power Query Editor's Close & Apply button.

A Power BI Desktopról és képességeiről a következő forrásokban talál további információt: