Olvasás angol nyelven

Megosztás a következőn keresztül:


Sorok csoportosítása vagy összegzése

A Power Queryben a különböző sorok értékeit egyetlen értékre csoportosíthatja úgy, hogy a sorokat egy vagy több oszlop értékei szerint csoportosítja. Kétféle csoportosítási művelet közül választhat:

  • Oszlopcsoportok.

  • Sorcsoportok.

Ebben az oktatóanyagban a következő mintatáblát használja.

Minta kezdeti tábla.

Képernyőkép egy táblázatról, amelyen az Év (2020), az Ország (USA, Panama vagy Kanada), a Termék (Póló vagy Rövidnadrág), az Értékesítési csatorna (Online vagy Viszonteladó) és az Egységek (55–7500 közötti különböző értékek) oszlopai láthatók.

A Csoportosítás gomb helye

A Csoportosítás gomb három helyen található:

  • A Kezdőlap lap Átalakítás csoportjában.

    Képernyőkép a Power Query menüszalagjáról a Kezdőlap lapon kiemelt Csoportosítás beállítással.

  • Az Átalakítás lap Táblázat csoportjában.

    Képernyőkép a Power Query menüszalagjáról az Átalakítás lapon kiemelt Csoportosítás beállítással.

  • A helyi menüben kattintson a jobb gombbal az oszlopok kijelöléséhez.

    Képernyőkép egy táblázatról, amelyen a helyi menüben a Csoportosítás beállítás van kiemelve.

Összesítő függvény használata egy vagy több oszlop szerinti csoportosításhoz

Ebben a példában a cél az ország és az értékesítési csatorna szintjén értékesített összes egység összegzése. Az Ország és az Értékesítési csatorna oszlopokkal hajthatja végre a csoportot művelet szerint.

  1. Válassza a Csoportosítás gombot a Kezdőlap lapon.
  2. Válassza a Speciális lehetőséget, így több oszlopot is kijelölhet a csoportosításhoz.
  3. Válassza ki az Ország oszlopot.
  4. Válassza a Csoportosítás hozzáadása lehetőséget.
  5. Válassza ki a Sales Channel oszlopot.
  6. Az Új oszlop nevére írja be az Összes egység kifejezést, a Művelet területen válassza az Összeg lehetőséget, majd az Oszlop területen válassza az Egységek lehetőséget.
  7. Kattintson az OK gombra

Képernyőkép a Csoportosítás párbeszédpanelről az összesített oszlopok kitöltésével.

Ez a művelet az alábbi táblázatot adja meg.

Képernyőkép a minta kimeneti tábláról az Ország, az Értékesítési csatorna és az Összes egység oszlopmal.

Elérhető műveletek

A Csoportosítás funkcióval az elérhető műveletek kétféleképpen kategorizálhatók:

  • Sorszintű művelet
  • Oszlopszintű művelet

Az alábbi táblázat ezeket a műveleteket ismerteti.

Művelet neve Kategória Leírás
Összeg Oszlopművelet Egy oszlop összes értékének összegzése
Átlagos Oszlopművelet Egy oszlop átlagértékének kiszámítása
Medián Oszlopművelet Kiszámítja a mediánt egy oszlopból
Min Oszlopművelet Egy oszlop minimális értékének kiszámítása
Max Oszlopművelet Egy oszlop maximális értékének kiszámítása
Percentilis Oszlopművelet A percentilis kiszámítása 0 és 100 közötti bemeneti értékkel egy oszlopból
Eltérő értékek megszámlálva Oszlopművelet Az oszloptól eltérő értékek számának kiszámítása
Sorok megszámlálása Sorművelet Kiszámítja egy adott csoport sorainak teljes számát
Különálló sorok megszámlálása Sorművelet Kiszámítja az adott csoporttól eltérő sorok számát
Minden sor Sorművelet Egy táblaérték összes csoportosított sorát összesítés nélkül adja ki

Megjegyzés

A különböző értékek és percentilis műveletek száma csak a Power Query Online-ban érhető el.

Művelet végrehajtása egy vagy több oszlop szerinti csoportosításhoz

Az eredeti mintától kezdve ebben a példában egy olyan oszlopot hoz létre, amely tartalmazza a teljes egységeket és két másik oszlopot, amelyek az ország és az értékesítési csatorna szintjén összegzett, a legjobban teljesítő termék nevét és értékesített egységeit adják meg.

Képernyőkép a műveleti minta kimeneti tábláról.

  1. A következő oszlopokat használja csoportosítási oszlopként:

    • Ország
    • Értékesítési csatorna
  2. Hozzon létre két új oszlopot az alábbi lépések végrehajtásával:

    1. Összesíti az Egységek oszlopot az Összeg művelettel. Nevezze el ezt az oszlopot Összes egységnek.
    2. Adjon hozzá egy új Termékek oszlopot a Minden sor művelettel.

    Képernyőkép a Csoportosítás párbeszédpanelről egy nem összesítő oszlopmal.

A művelet befejezése után figyelje meg, hogy a Termékek oszlopban a [Table] értékek szerepelnek az egyes cellákban. Minden [Tábla] érték tartalmazza azokat a sorokat, amelyeket az eredeti tábla Ország és Értékesítési csatorna oszlopai csoportosítottak. A cellán belüli üres terület kiválasztásával megtekintheti a táblázat tartalmának előnézetét a párbeszédpanel alján.

Képernyőkép a táblázat részleteinek előnézeti paneljéről.

Megjegyzés

Előfordulhat, hogy a részletek előnézete panel nem jeleníti meg a csoportosítási művelethez használt összes sort. A [Tábla] érték kiválasztásával megtekintheti a megfelelő csoportosítási művelethez tartozó összes sort.

Ezután ki kell nyernie azt a sort, amely a legmagasabb értéket tartalmazza az új Termékek oszlopban lévő táblák Egységek oszlopában, és ezt az új oszlopot kell meghívnia a legjobban teljesítő terméknek.

A legjobb teljesítményt nyújtó termékinformációk kinyerése

A [Tábla] értékeket tartalmazó új Termékek oszlopban új egyéni oszlopot hozhat létre a menüszalag Oszlop hozzáadása lapján, és az Általános csoport Egyéni oszlopa lehetőséget választva.

Képernyőkép a Power Query menüszalagjáról az Oszlop hozzáadása lapon kiemelt Egyéni oszlop beállítással.

Nevezze el az új oszlop legjobban teljesítő termékét. Írja be a képletet Table.Max([Products], "Units" ) az Egyéni oszlop képlete mezőbe.

Képernyőkép az Egyéni oszlop párbeszédpanelről, amelyen be van írva a Table.Max képlete.

A képlet eredménye egy új oszlopot hoz létre [Rekord] értékekkel. Ezek a rekordértékek lényegében csak egy sorból állnak. Ezek a rekordok tartalmazzák a Termékek oszlopban lévő [Tábla] értékek Egység oszlopának maximális értékét tartalmazó sort.

Képernyőkép az egyéni oszlopképlet eredményéről a Table.Max használatával.

Ezzel az új, [Rekord] értékeket tartalmazó legjobban teljesítő termékoszlopban kiválaszthatja a kibontás ikont, kiválaszthatja a Termék és egység mezőket, majd az OK gombot.

Képernyőkép a Felső teljesítményű termék oszlop rekordértékének kibontási műveletéről.

Miután eltávolította a Termékek oszlopot, és beállította mindkét újonnan kibontott oszlop adattípusát, az eredmény az alábbi képhez fog hasonlítni.

Képernyőkép az összes átalakítást tartalmazó utolsó tábláról.

Homályos csoportosítás

Megjegyzés

Az alábbi funkció csak a Power Query Online-ban érhető el.

A "homályos csoportosítás" módjának bemutatásához tekintse meg az alábbi képen látható mintatáblát.

Képernyőkép egy tábláról, amelyen kilenc sornyi bejegyzés található, amelyek a Miguel és William név különböző helyesírását és nagybetűit tartalmazzák.

A homályos csoportosítás célja egy olyan csoportosítási művelet végrehajtása, amely egy hozzávetőleges egyező algoritmust használ a szöveges sztringekhez. A Power Query a Jaccard-hasonlósági algoritmust használja a példánypárok közötti hasonlóság mérésére. Ezután agglomeratív hierarchikus fürtözést alkalmaz a csoportpéldányokra. Az alábbi képen a várt kimenet látható, ahol a táblázat a Person oszlop szerint van csoportosítva.

Képernyőkép egy tábláról, amelyen a Személy miguel és Mike bejegyzései, illetve a 3. és a 2. gyakoriság látható.

A homályos csoportosítás elvégzéséhez hajtsa végre a cikkben korábban ismertetett lépéseket. Az egyetlen különbség az, hogy ezúttal a Csoportosítás párbeszédpanelen bejelöli a Homályos csoportosítás használata jelölőnégyzetet.

Képernyőkép a Csoportosítás párbeszédpanel Fuzzy csoportosítás jelölőnégyzetéről.

A Power Query minden sorcsoport esetében a leggyakoribb példányt a "canonical" példányként választja ki. Ha több példány is előfordul ugyanazzal a gyakorisággal, a Power Query az elsőt választja ki. Miután a Csoportosítás párbeszédpanelen az OK gombot választja, megkapja a várt eredményt.

Képernyőkép a Fuzzy csoportosítási minta utolsó tábláról, nincs átalakító tábla.

A Fuzzy csoportbeállítások kibontásával azonban jobban szabályozhatja a homályos csoportosítási műveletet.

Képernyőkép a Csoportosítás párbeszédpanelről a Fuzzy csoport beállításainak kiemelésével.

A fuzzy csoportosításhoz a következő lehetőségek érhetők el:

  • Hasonlóság küszöbértéke (nem kötelező):Ez a beállítás azt jelzi, hogy a két értéknek hogyan kell csoportosítania. A nulla (0) minimális beállítása miatt az összes érték csoportosítva lesz. Az 1 érték maximális beállítása csak a pontosan egyező értékek csoportosítását teszi lehetővé. Az alapértelmezett érték 0,8.
  • Kis- és nagybetűk figyelmen kívül hagyása: Szövegsztringek összehasonlítása esetén a kis- és nagybetűk figyelmen kívül lesznek hagyva. A beállítás alapértelmezés szerint engedélyezett.
  • Csoportosítás szövegrészek kombinálásával: Az algoritmus megpróbálja egyesíteni a szövegrészeket (például a Micro és a Soft egyesítését a Microsofttal) az értékek csoportosításához.
  • Hasonlósági pontszámok megjelenítése: Hasonlósági pontszámok megjelenítése a bemeneti értékek és a számított reprezentatív értékek között a homályos csoportosítás után. Egy olyan művelet hozzáadását igényli, mint a Minden sor , hogy sorról sorra mutassa ezeket az információkat.
  • Transzformációs táblázat (nem kötelező):Kiválaszthat egy olyan átalakítási táblát, amely az értékeket leképezi (például az MSFT-et a Microsofthoz rendeli), hogy csoportosítsa őket.

Ebben a példában egy transzformációs táblázat mutatja be, hogyan lehet az értékeket megfeleltetni. Az átalakítási táblázat két oszlopból áll:

  • Feladó: A táblázatban keresni kívánt szöveges sztring.
  • To: Az a szöveges sztring, amely a Feladó oszlopban lévő szövegsztring helyére lesz behelyettesíteni.

Az alábbi képen az ebben a példában használt transzformációs táblázat látható.

Képernyőkép a tábláról, amelyen Mike és William értékei, Miguel és Bill értékei láthatók.

Fontos

Fontos, hogy az átalakítási táblázat ugyanazokat az oszlopokat és oszlopneveket tartalmazza, mint az előző képen (a "Feladó" és a "Címzett" címkével kell rendelkezniük). Ellenkező esetben a Power Query nem ismeri fel a táblát átalakítási táblaként.

Térjen vissza a Csoportosítás párbeszédpanelre, bontsa ki az Fuzzy csoport beállításait, módosítsa a műveletet a Darabszám sorról a Minden sorra, engedélyezze a Hasonlósági pontszámok megjelenítése lehetőséget, majd válassza az Átalakítás tábla legördülő menüt.

Képernyőkép a fuzzy grouping sample transformation table legördülő menüről.

Az átalakítási tábla kiválasztása után kattintson az OK gombra. A művelet eredménye a következő információkat adja meg:

Képernyőkép a végleges tábla fuzzy csoportosítási mintájáról transzformációs táblázattal.

Ebben a példában engedélyezve volt a Kis- és nagybetűk figyelmen kívül hagyása beállítás, így az Átalakítás tábla From oszlopában lévő értékek a szöveges sztring keresésére szolgálnak anélkül, hogy figyelembe vennék a sztring esetét. Ez az átalakítási művelet először megtörténik, majd a rendszer végrehajtja a homályos csoportosítási műveletet.

A hasonlósági pontszám a személy oszlop melletti táblaértékben is megjelenik, amely pontosan tükrözi az értékek csoportosításának módját és a hozzájuk tartozó hasonlósági pontszámokat. Szükség esetén kibonthatja ezt az oszlopot, vagy használhatja az új gyakorisági oszlopok értékeit más típusú átalakításokhoz.

Megjegyzés

Ha több oszlop szerint csoportosít, az átalakítási tábla minden oszlopban végrehajtja a csereműveletet, ha az érték cseréje növeli a hasonlósági pontszámot.

Az átalakítási táblák működéséről az Átalakítás tábla parancsai című témakörben talál további információt.

Lásd még

Egyéni oszlop hozzáadása
Ismétlődések eltávolítása