Főbb befolyásolók vizualizációinak létrehozása

A következőkre vonatkozik: Power BI Desktop Power BI szolgáltatás

A főbb befolyásolók vizualizációja segít megérteni azokat a tényezőket, amelyek egy önt érdeklő metrikát befolyásolnak. Elemzi az adatokat, rangsorolja azokat a tényezőket, amelyek fontosak, és fő befolyásolóként jeleníti meg őket. Tegyük fel például, hogy szeretné megtudni, hogy mi befolyásolja az alkalmazottak forgalmát, amelyet más néven változásnak neveznek. Az egyik tényező lehet a munkaszerződés hossza, egy másik tényező pedig az ingázás ideje.

Mikor érdemes használni a főbb befolyásolókat?

A főbb befolyásolók vizualizációja nagyszerű választás, ha a következőt szeretné:

  • Ellenőrizze, hogy mely tényezők befolyásolják az elemzett metrikát.
  • A tényezők relatív fontosságának kontrasztos ábrázolása. Például a rövid távú szerződések a hosszú távú szerződéseknél jobban befolyásolják a forgalomváltozást?

A főbb befolyásolók vizualizációjának jellemzői

Screenshot of the numbered features of the key influencers visual.

  1. Tabulátorok: Válasszon ki egy lapot a nézetek közötti váltáshoz. A főbb befolyásolók a kiválasztott metrikaérték legfontosabb közreműködőit jelenítik meg. A felső szegmensek azokat a felső szegmenseket jelenítik meg, amelyek hozzájárulnak a kiválasztott metrikaértékhez. A szegmensek értékek kombinációjából áll. Az egyik szegmens lehet például az a fogyasztók, akik legalább 20 éve ügyfelek, és a nyugati régióban élnek.

  2. Legördülő lista: A vizsgált metrika értéke. Ebben a példában tekintse meg a metrikaminősítést. A kijelölt érték alacsony.

  3. Restatement: Segít értelmezni a vizualizációt a bal oldali panelen.

  4. Bal oldali ablaktábla: A bal oldali panel egyetlen vizualizációt tartalmaz. Ebben az esetben a bal oldali panelen a legfontosabb befolyásolók listája látható.

  5. Restatement: Segít értelmezni a vizualizációt a jobb oldali panelen.

  6. Jobb oldali ablaktábla: A jobb oldali panel egy vizualizációt tartalmaz. Ebben az esetben az oszlopdiagram a bal oldali panelen kiválasztott fő befolyásoló téma összes értékét megjeleníti. A bal oldali panel használhatóságának konkrét értéke zöld színnel jelenik meg. A Téma többi értéke fekete színben jelenik meg.

  7. Átlagvonal: Az átlagot a téma összes lehetséges értékére számítjuk ki, kivéve a használhatóságot (amely a kiválasztott befolyásoló). A számítás tehát a fekete színben lévő összes értékre vonatkozik. Ez megmutatja, hogy a többi téma hány százaléka volt alacsony értékeléssel. Ebben az esetben a 11,35% alacsony értékelést kapott (a pontozott vonal mutatja).

  8. Jelölőnégyzet: Kiszűri a vizualizációt a jobb oldali panelen, hogy csak az adott mező befolyásoló értékei jelenjenek meg. Ebben a példában a vizualizáció a használhatóság, a biztonság és a navigáció megjelenítésére lesz szűrve.

Kategorikus metrikák elemzése

Ebből a videóból megtudhatja, hogyan hozhat létre fő befolyásoló vizualizációkat kategorikus metrikával. Ezután a lépések végrehajtásával hozzon létre egyet.

Feljegyzés

Ez a videó a Power BI Desktop vagy a Power BI szolgáltatás korábbi verzióit használhatja.

  1. A Termékmenedzser szeretné megtudni, hogy mely tényezők vezetik az ügyfeleket arra, hogy negatív véleményeket hagyjanak a felhőszolgáltatásról. A Power BI Desktopban való folytatáshoz nyissa meg a Customer Feedback PBIX fájlt.

Feljegyzés

Az Ügyfélvisszajelzés adatkészlet alapja [Moro et al., 2014] S. Moro, P. Cortez és P. Rita. "Adatvezérelt megközelítés a banki telemarketing sikerének előrejelzéséhez." Döntéstámogatási rendszerek, Elsevier, 62:22-31, 2014. június.

  1. A Vizualizációk panelEn a Vizualizációk létrehozása panelen válassza a Főbb befolyásolók ikont.

    Screenshot of the Key influencers icon on the Visualizations pane.

  2. Helyezze át a vizsgálandó metrikát az Elemzés mezőbe. Ha meg szeretné tekinteni, hogy mi hajtja alacsonyra a szolgáltatás ügyfélminősítését, válassza a Customer Table Rating (Ügyféltábla-minősítés>) lehetőséget.

  3. Helyezze át azokat a mezőket, amelyek véleménye szerint befolyásolhatják az Értékelés mezőt a Magyarázat mező szerint mezőbe. Tetszőleges számú mezőt áthelyezhet. Ebben az esetben kezdje a következőkkel:

    • Country-Region
    • Szerepkör a szervezetben
    • Előfizetés típusa
    • Vállalat mérete
    • Téma
  4. Hagyja üresen a Kibontás mező szerint mezőt. Ez a mező csak mérték vagy összegzett mező elemzésekor használatos.

  5. A negatív értékelésekre való összpontosításhoz válassza az Alacsony lehetőséget a Minősítést befolyásoló tényezők legördülő listában.

    Screenshot of the drop-down box with high and low options.

Az elemzés az elemzett mező táblaszintjén fut. Ebben az esetben ez az Értékelés metrika. Ez a metrika ügyfélszinten van definiálva. Minden ügyfél magas vagy alacsony pontszámot adott. Az összes magyarázó tényezőt az ügyfél szintjén kell meghatározni ahhoz, hogy a vizualizáció felhasználhassa őket.

Az előző példában az összes magyarázó tényező egy-az-egyhez vagy több-az-egyhez kapcsolattal rendelkezik a metrikával. Ebben az esetben minden ügyfél egyetlen témát rendelt hozzá az értékeléshez. Hasonlóképpen, az ügyfelek egy országból vagy régióból származnak, egy tagsági típussal rendelkeznek, és egy szerepkört töltenek be a szervezetükben. A magyarázó tényezők már az ügyfél attribútumai, és nincs szükség átalakításokra. A vizualizáció azonnal felhasználhatja őket.

Az oktatóanyag későbbi részében összetettebb példákat tekinthet meg, amelyek egy-a-többhöz kapcsolatokkal rendelkeznek. Ezekben az esetekben az oszlopokat először az ügyfél szintjén kell összesíteni, mielőtt futtathatja az elemzést.

A magyarázó tényezőként használt mértékeket és aggregátumokat az Elemzés metrika táblaszintjén is kiértékeljük. Néhány példa a cikk későbbi részében látható.

Kategorikus kulcs befolyásolóinak értelmezése

Vessünk egy pillantást az alacsony értékelések főbb befolyásolóira.

Az alacsony minősítés valószínűségét befolyásoló legfontosabb egyetlen tényező

A példában szereplő ügyfélnek három szerepköre lehet: fogyasztó, rendszergazda és közzétevő. Fogyasztónak lenni a legfontosabb tényező, amely hozzájárul az alacsony értékeléshez.

Screenshot of key influencers, with Role in Org is consumer selected.

Pontosabban a fogyasztók 2,57-szer nagyobb valószínűséggel adnak negatív pontszámot a szolgáltatásnak. A főbb befolyásolók diagramja a szervezeti szerepköröket a bal oldali listában elsőként a fogyasztónak sorolja fel. Ha kiválasztja a Szervezeti szerepkör fogyasztó, a Power BI további részleteket jelenít meg a jobb oldali panelen. Az egyes szerepkörök összehasonlító hatása az alacsony minősítés valószínűségére látható.

  • A fogyasztók 14,93%-a ad alacsony pontszámot.
  • Az összes többi szerepkör átlagosan az idő 5,78%-ának ad alacsony pontszámot.
  • A fogyasztók 2,57-szer nagyobb valószínűséggel adnak alacsony pontszámot az összes többi szerepkörhöz képest. Ezt a pontszámot úgy határozhatja meg, hogy elosztja a zöld sávot a piros pontozott vonallal.

A második egyetlen tényező, amely befolyásolja az alacsony minősítés valószínűségét

A főbb befolyásolók vizualizációja számos különböző változó tényezőit hasonlítja össze és rangsorolja. A második befolyásolónak semmi köze a szervezeti szerepkörhöz. Válassza ki a második befolyásolót a listában, amely a Téma használhatóság.

Screenshot of key influencers, with Theme is usability selected.

A második legfontosabb tényező az ügyfél véleményének témájához kapcsolódik. Azok az ügyfelek, akik a termék használhatóságával kapcsolatos megjegyzéseket fűztek, 2,55-szer nagyobb valószínűséggel adtak alacsony pontszámot, mint azok az ügyfelek, akik más témákat, például megbízhatóságot, kialakítást vagy sebességet kommentáltak.

A vizualizációk között a piros pontozott vonal által megjelenített átlag 5,78%-ról 11,35%-ra változott. Az átlag dinamikus, mert az összes többi érték átlagán alapul. Az első befolyásoló esetében az átlag kizárta az ügyfélszerepkört. A második befolyásoló esetében kizárta a használhatósági témát.

Jelölje be a Csak befolyásoló értékek megjelenítése jelölőnégyzetet, hogy csak a befolyásos értékek használatával szűrjön. Ebben az esetben ezek a szerepkörök vezetnek alacsony pontszámot. 12 téma a Power BI által az alacsony értékeléseket eredményező témákként azonosított négy témára csökken.

Screenshot of check box to only show values that are influencers.

Más vizualizációk használata

Minden alkalommal, amikor kiválaszt egy szeletelőt, szűrőt vagy más vizualizációt a vásznon, a főbb befolyásolók vizualizációja újrafuttatja az elemzést az új adatrészen. Áthelyezheti például a Cégméretet a jelentésbe, és szeletelőként használhatja. Ezzel megállapíthatja, hogy a vállalati ügyfelek fő befolyásolói eltérnek-e az általános populációtól. A vállalati vállalat mérete meghaladja az 50 000 alkalmazottat.

Az elemzés újrafuttatásához válassza >az 50 000-et , és láthatja, hogy a befolyásolók megváltoztak. A nagyvállalati ügyfelek számára az alacsony minősítések legfőbb befolyásolója a biztonsággal kapcsolatos témával rendelkezik. Érdemes lehet részletesebben megvizsgálnia, hogy vannak-e olyan biztonsági funkciók, amelyekkel a nagy ügyfelek elégedetlenek.

Screenshot of visual to select by company size.

Folyamatos kulcs befolyásolóinak értelmezése

Eddig láthatta, hogyan használhatja a vizualizációt annak vizsgálatára, hogy a különböző kategorikus mezők hogyan befolyásolják az alacsony értékeléseket. A Magyarázó mezőben folyamatos tényezők is lehetnek, például az életkor, a magasság és az ár. Nézzük meg, mi történik, ha a Bérlő átkerül az ügyféltáblából a Explain by (Magyarázat) táblába. A bérleti idő azt mutatja be, hogy az ügyfél mennyi ideig használta a szolgáltatást.

A bérleti idő növekedésével az alacsonyabb minősítések valószínűsége is nő. Ez a trend arra utal, hogy a hosszabb távú ügyfelek nagyobb valószínűséggel adnak negatív pontszámot. Ez a megállapítás érdekes, és amelyet később érdemes követnie.

A vizualizáció azt mutatja, hogy minden alkalommal, amikor a bérleti idő 13,44 hónappal nő, az alacsony minősítés valószínűsége átlagosan 1,23-szor nő. Ebben az esetben a 13,44 hónap a bérleti idő szórását ábrázolja. A kapott megállapítás tehát azt vizsgálja, hogy a standard összeggel való növekvő bérleti idő, azaz a bérlet szórása milyen hatással van az alacsony minősítés valószínűségére.

A jobb oldali panel pontdiagramja az alacsony minősítések átlagos százalékos arányát ábrázolja az egyes bérleti értékekhez. Trendvonallal emeli ki a meredekségeket.

Screenshot of scatter plot for Tenure.

Rögzített folyamatos fő befolyásolók

Bizonyos esetekben előfordulhat, hogy a folyamatos tényezők automatikusan kategorikusakká lettek alakítva. Ha a változók közötti kapcsolat nem lineáris, nem írhatjuk le egyszerűen növekvő vagy csökkenő kapcsolatként (mint a fenti példában).

Korrelációs teszteket futtatunk annak meghatározására, hogy a befolyásoló mennyire lineáris a cél szempontjából. Ha a cél folyamatos, Pearson-korrelációt futtatunk, és ha a cél kategorikus, point biserial korrelációs teszteket futtatunk. Ha azt észleljük, hogy a kapcsolat nem elég lineáris, felügyelt tárolót végzünk, és legfeljebb öt tárolót hozunk létre. Annak megállapításához, hogy mely tárolók a legérthetőbbek, egy felügyelt binning metódust használunk, amely megvizsgálja a magyarázó tényező és az elemzett cél közötti kapcsolatot.

Mértékek és aggregátumok értelmezése fő befolyásolókként

Az elemzésben mértékeket és aggregátumokat használhat magyarázó tényezőként. Előfordulhat például, hogy szeretné látni, hogy az ügyfélszolgálati jegyek száma vagy egy nyitott jegy átlagos időtartama milyen hatással van a kapott pontszámra.

Ebben az esetben azt szeretné megtudni, hogy az ügyfél által megadott támogatási jegyek száma befolyásolja-e az általuk adott pontszámot. Most be kell állítania a támogatási jegy azonosítóját a támogatási jegy táblából. Mivel egy ügyfél több támogatási jegyet is használhat, az azonosítót az ügyfél szintjén összesítheti. Az összesítés azért fontos, mert az elemzés az ügyfél szintjén fut, ezért az összes illesztőprogramot ezen a részletességi szinten kell meghatározni.

Nézzük meg az azonosítók számát. Minden ügyfélsorhoz számos támogatási jegy tartozik. Ebben az esetben a támogatási jegyek számának növekedésével az alacsony minősítés valószínűsége 4,08-szor nő. A jobb oldali vizualizáció az ügyfélszinten kiértékelt különböző minősítési értékek alapján mutatja a támogatási jegyek átlagos számát.

Screenshot that shows influence of Support Ticket ID.

Az eredmények értelmezése: Felső szegmensek

A Főbb befolyásolók lapon egyenként értékelheti az egyes tényezőket. A Felső szegmensek lapon azt is megtekintheti, hogy a tényezők kombinációja hogyan befolyásolja az elemzett metrikát.

A felső szegmensek kezdetben áttekintést ad a Power BI által felderített összes szegmensről. Az alábbi példa hat szegmenst mutat be. Ezeket a szegmenseket a szegmensen belüli alacsony minősítések százalékos aránya sorolja fel. Az 1. szegmens például 74,3%-os ügyfélminősítéssel rendelkezik, amelyek alacsonyak. Minél magasabb a buborék, annál nagyobb az alacsony értékelések aránya. A buborék mérete azt jelzi, hogy hány ügyfél van a szegmensben.

Screenshot of Top segments tab selected.

Ha kijelöl egy buborékot, az adott szegmens részleteit jeleníti meg. Ha például az 1. szegmenst választja, azt tapasztalja, hogy az viszonylag bevált ügyfelekből áll. Több mint 29 hónapja ügyfeleik, és négynél több támogatási jegyük van. Végül pedig nem közzétevők, tehát vagy felhasználók vagy rendszergazdák.

Ebben a csoportban az ügyfelek 74,3%-a adott alacsony értékelést. Az átlagos ügyfél az idő 11,7%-át adta alacsony minősítéssel, így ez a szegmens nagyobb arányban rendelkezik alacsony értékelésekkel. Ez 63 százalékponttal magasabb. Az 1. szegmens az adatok körülbelül 2,2%-át is tartalmazza, így a populáció egy kezelhető részét képviseli.

Screenshot of top segment according to rating.

Darabszámok hozzáadása

Előfordulhat, hogy a befolyásolók jelentős hatással bírnak, de kevés adatot képviselnek. A téma például a használhatóság a harmadik legnagyobb befolyásoló tényező az alacsony értékelések esetében. Előfordulhat azonban, hogy csak néhány ügyfél panaszkodott a használhatóságra. A számokkal rangsorolhatja, hogy mely befolyásolókra szeretne összpontosítani.

A számokat a formázási panel Elemzés kártyáján kapcsolhatja be.

Screenshot of enable counts slider in the Format pane.

A számok engedélyezése után egy gyűrű jelenik meg az egyes befolyásolók buborékja körül, amely a befolyásoló által tartalmazott adatok hozzávetőleges százalékos arányát jelöli. Minél több buborékot tartalmaz a gyűrű, annál több adatot tartalmaz. Láthatjuk, hogy a Téma használhatóságkis mennyiségű adatot tartalmaz.

Screenshot of rings that around influencer bubbles that represent counts.

A vizualizáció bal alsó sarkában található Rendezés váltógombbal is rendezheti a buborékokat az ütközés helyett a darabszám alapján. Az előfizetés típusa a Premier a legnagyobb befolyásoló tényező a szám alapján.

Screenshot of the Sort by toggle to sort by counts first.

Ha a kör körül teljes kör van, az azt jelenti, hogy a befolyásoló az adatok 100%-át tartalmazza. A számtípust a formázási panel Elemzés kártyájának Darabszám típusa legördülő menüjében módosíthatja úgy, hogy a legnagyobb befolyásolóhoz képest legyen. Most a legtöbb adattal rendelkező befolyásolót egy teljes gyűrű fogja képviselni, és az összes többi szám hozzá lesz viszonyítva.

Screenshot that shows the relative counts drop-down menu.

Numerikus metrika elemzése

Ha nem kijelölt numerikus mezőt helyez át az Elemzés mezőbe, választhat, hogyan kezelheti ezt a forgatókönyvet. A vizualizáció viselkedését módosíthatja a Formázás panelen, és válthat a kategorikus elemzési típus és a folyamatos elemzési típus között.

Screenshot of drop-down menu to change from categorical to continuous.

A kategorikus elemzési típus a fent leírt módon viselkedik. Ha például 1 és 10 közötti felmérési pontszámokat vizsgál, megkérdezheti a "Mi befolyásolja a felmérési pontszámokat 1-nek?" kérdést.

A folyamatos elemzési típus folytonosra módosítja a kérdést. A fenti példában az új kérdés a következő lenne: "Mi befolyásolja a felmérési pontszámokat a növekedéshez/csökkenéshez?".

Ez a különbség akkor hasznos, ha sok egyedi értéket tartalmaz az elemzett mezőben. Az alábbi példában a lakásárakat vizsgáljuk meg. Nem értelme megkérdezni, hogy "Mi befolyásolja House Price, hogy 156,214?" mivel ez nagyon specifikus, és valószínűleg nem lesz elég adatunk egy minta következtetéséhez.

Ehelyett feltehetjük a kérdést: "Mi befolyásolja a házárat a növekedéshez"? amely lehetővé teszi, hogy a lakásárakat tartományként kezeljük, nem pedig különböző értékeket.

Screenshot of drop-down options to choose influencers.

Az eredmények értelmezése: Főbb befolyásolók

Feljegyzés

Az ebben a szakaszban szereplő példák a nyilvános tartomány ingatlanárainak adatait használják. Ha követni szeretné, letöltheti a mintaadatkészletet.

Ebben a forgatókönyvben a "What influences House Price to increase" (Mi befolyásolja a házárakat a növekedésre) című témakört vizsgáljuk meg. Számos magyarázó tényező befolyásolhatja a ház árát, például a Year Built (a ház építésének éve), a KitchenQual (konyha minősége) és a YearRemodAdd (a ház átépítésének éve).

Az alábbi példában a legjobb befolyásolót vizsgáljuk meg, amely a konyha minősége kiváló. Az eredmények hasonlóak azokhoz, amelyeket a kategorikus metrikák elemzésekor láttunk néhány fontos különbséggel:

  • A jobb oldali oszlopdiagram a százalékok helyett az átlagokat vizsgálja. Ezért megmutatja nekünk, hogy egy kiváló konyhával rendelkező ház átlagos házára (zöld bár) a kiváló konyha nélküli ház átlagos házáraihoz képest (pontozott vonal)
  • A buborékban lévő szám továbbra is a piros pontozott vonal és a zöld sáv közötti különbség, de a valószínűség (1,93x) helyett számként (158,49 000 USD) van kifejezve. Tehát átlagosan a kiváló konyhával rendelkező házak majdnem 160 ezer dollárral drágábbak, mint a kiváló konyha nélküli házak.

Screenshot of numeric target categorical influencers.

Az alábbi példában azt vizsgáljuk meg, hogy egy folyamatos tényező (az év házát átalakították) milyen hatással van a lakásárakra. A kategorikus metrikák folyamatos befolyásolóinak elemzésével kapcsolatos különbségek a következők:

  • A jobb oldali panel pontdiagramja az újramodellezett év különböző értékeinek átlagos ingatlanárat ábrázolja.
  • A buborék értéke azt mutatja, hogy mennyivel nő az átlagos lakásár (ebben az esetben 2,87 ezer dollár), amikor a házat újramodellezették a szórással (ebben az esetben 20 év)

Screenshot of numeric target continuous influencers.

Végül a mértékek esetében azt vizsgáljuk, hogy egy ház átlagosan hogyan épült. Az elemzés a következő:

  • A jobb oldali panel pontdiagramja a táblázat egyes különböző értékeinek átlagos házárat ábrázolja
  • A buborék értéke azt mutatja, hogy mennyivel nő az átlagos lakásár (ebben az esetben 1,35 000 USD), amikor az átlagos év a szórásával (ebben az esetben 30 év) növekszik.

Screenshot of Key influencers for house prices with influencers on the left and the scatterplot on the right.

Az eredmények értelmezése: Felső szegmensek

A numerikus célok felső szegmensei olyan csoportokat mutatnak, ahol a lakásárak átlagosan magasabbak, mint a teljes adatkészletben. Az alábbiakban például láthatjuk, hogy az 1 . szegmens olyan házakból áll, ahol a GarageCars (a garázsban elférő autók száma) nagyobb, mint 2, a RoofStyle pedig Hip. Az ilyen jellemzőkkel rendelkező házak átlagos ára 355 000 USD az adatokban szereplő teljes átlaghoz képest, amely 180 000 USD.

Screenshot that shows Top segments for house prices.

Mérték vagy összegzett oszlop metrikáinak elemzése

Mérték vagy összegzett oszlop esetén az elemzés alapértelmezés szerint a fent leírt folyamatos elemzési típusra vonatkozik. Ezek az adatok nem módosíthatók. A mérték/összegzett oszlop és a nem kijelölt numerikus oszlop elemzése között a legnagyobb különbség az a szint, amelyen az elemzés fut.

Nem kijelölt oszlopok esetén az elemzés mindig a tábla szintjén fut. A fenti lakásár-példában elemeztük a Házár metrikát, hogy lássuk, mi befolyásolja a lakásárakat a növekedés/csökkenés érdekében. Az elemzés automatikusan a táblázat szintjén fut. A táblázat minden házhoz egyedi azonosítóval rendelkezik, így az elemzés házszinten fut.

Screenshot that shows the table level analysis for the house price example.

A mértékek és az összesített oszlopok esetében nem tudjuk azonnal, hogy milyen szinten elemezzük őket. Ha a házárat átlagként összegezzük, akkor figyelembe kell vennünk, hogy milyen szinten szeretnénk kiszámítani ezt az átlagos lakásárat. Ez az átlagos házár a környék szintjén? Vagy talán regionális szinten?

A mértékeket és az összesített oszlopokat a rendszer automatikusan elemzi a használt mezők magyarázatának szintjén. Tegyük fel, hogy három mező van a Explain By minket érdekel: Konyha minősége, épület típusa és légkondicionáló. Az átlagos házárat a rendszer a három mező minden egyedi kombinációjára számítja ki. Gyakran hasznos, ha táblázatnézetre vált, hogy megtekintse a kiértékelt adatok megjelenését.

Screenshot that shows the three columns and the average house price.

Ez az elemzés nagyon összefoglalva van, ezért a regressziós modell nehezen talál mintázatokat azokban az adatokban, amelyekből tanulhat. A jobb eredmények érdekében részletesebben kell futtatnunk az elemzést. Ha a lakásárat a ház szintjén szeretnénk elemezni, explicit módon hozzá kell adnunk az azonosító mezőt az elemzéshez. Mindazonáltal nem akarjuk, hogy a házazonosító befolyásolónak minősüljön. Nem hasznos megtanulni, hogy a házazonosító növekedésével a ház ára nő. Itt hasznos lehet a Kibontás mezővel lehetőség. A Kibontással olyan mezőket adhat hozzá, amelyeket az elemzés szintjének beállításához szeretne használni új befolyásolók keresése nélkül.

Tekintse meg, hogyan néz ki a vizualizáció, ha hozzáadjuk az azonosítót a Kibontás gombra. Miután meghatározta a mérték kiértékelésének szintjét, a befolyásolók értelmezése pontosan ugyanaz, mint a nem kijelölt numerikus oszlopok esetében.

Screenshot that shows the house price visualization that depends on the three columns discussed in this section.

Ha többet szeretne megtudni arról, hogyan elemezheti a mértékeket a főbb befolyásolók vizualizációjával, tekintse meg az alábbi videót. Ha meg szeretné tudni, hogyan használja a Power BI ML.NET a háttérben az adatok és a felszíni megállapítások természetes módon történő okának megismeréséhez, olvassa el a Power BI a főbb befolyásolókat a ML.NET használatával.

Feljegyzés

Ez a videó a Power BI Desktop vagy a Power BI szolgáltatás korábbi verzióit használhatja.

Megfontolandó szempontok és hibaelhárítás

Milyen korlátozások vonatkoznak a vizualizációra?

A főbb befolyásolók vizualizációja bizonyos korlátozásokkal rendelkezik:

  • A Közvetlen lekérdezés nem támogatott
  • Az Azure Analysis Services és az SQL Server Analysis Services élő Csatlakozás használata nem támogatott
  • A webes közzététel nem támogatott
  • .NET-keretrendszer 4,6-os vagy újabb verzió szükséges
  • A SharePoint Online beágyazása nem támogatott

Screenshot of drop-down choices for numeric question

Hibaüzenetet látok, hogy nem találhatók befolyásolók vagy szegmensek. Miért?

Screenshot of no influencers found error message.

Ez a hiba akkor fordul elő, ha a Magyarázó mezőben mezőket vett fel, de nem találtak befolyásolókat.

  • Az Elemzett és a Magyarázó elemzett metrikát is belefoglalta. Távolítsa el a Magyarázó parancsból.
  • A magyarázó mezők túl sok kategóriával rendelkeznek, kevés megfigyeléssel. Ez a helyzet megnehezíti a vizualizáció számára, hogy meghatározza, mely tényezők befolyásoló tényezők. Csak néhány megfigyelés alapján nehéz általánosítani. Ha numerikus mezőt elemez, érdemes lehet áttérni a Kategorikus elemzésről a Folyamatos elemzésre az Elemzés kártya Formázás paneljén.
  • A magyarázó tényezőknek elegendő megfigyelésük van az általánosításhoz, de a vizualizáció nem talált értelmes összefüggéseket a jelentéshez.

Hibaüzenet jelenik meg, hogy az elemzett metrikának nincs elég adata az elemzés futtatásához. Miért?

Screenshot of not enough data error message.

A vizualizáció úgy működik, hogy egy csoport adatainak mintáit tekinti meg a többi csoporthoz képest. Például azokat az ügyfeleket keresi, akik alacsony értékelést adtak a magas értékelést adó ügyfelekhez képest. Ha a modell adatainak csak néhány megfigyelése van, a mintákat nehéz megtalálni. Ha a vizualizáció nem rendelkezik elegendő adatval az értelmes befolyásolók megtalálásához, az azt jelzi, hogy több adatra van szükség az elemzés futtatásához.

Javasoljuk, hogy legalább 100 megfigyelése legyen a kiválasztott állapotra vonatkozóan. Ebben az esetben az állam az ügyfelek, akik omlottak. Az összehasonlításhoz használt állapotokhoz legalább 10 megfigyelésre van szükség. Ebben az esetben az összehasonlítási állapot olyan ügyfelek, akik nem csúsznak.

Ha numerikus mezőt elemez, érdemes lehet áttérni a Kategorikus elemzésről a Folyamatos elemzésre az Elemzés kártya Formázás paneljén.

Hibaüzenet jelenik meg, amely szerint ha az "Elemzés" nincs összegezve, az elemzés mindig a szülőtábla sorszintjén fut. A szint "Kibontás" mezőkkel történő módosítása nem engedélyezett. Miért?

Numerikus vagy kategorikus oszlopok elemzésekor az elemzés mindig a táblázat szintjén fut. Ha például a lakásárakat elemzi, és a táblázat egy azonosító oszlopot tartalmaz, az elemzés automatikusan a házazonosító szintjén fog futni.

Mérték vagy összegzett oszlop elemzésekor explicit módon meg kell adnia, hogy az elemzés mely szinten fusson. A Kibontás használatával új befolyásolók hozzáadása nélkül módosíthatja a mértékek és az összesített oszlopok elemzési szintjét. Ha a házárat mértékként definiálták, hozzáadhatja a házazonosító oszlopot a Kibontáshoz az elemzés szintjének módosításához.

Hibaüzenet jelenik meg, amely szerint a Explain by mező nem kapcsolódik egyedileg az elemzett metrikát tartalmazó táblához. Miért?

Az elemzés az elemzett mező táblaszintjén fut. Ha például a szolgáltatáshoz tartozó ügyfélvisszajelzéseket elemzi, lehet, hogy van egy táblázata, amelyből megtudhatja, hogy egy ügyfél magas vagy alacsony értékelést adott-e. Ebben az esetben az elemzés az ügyféltábla szintjén fut.

Ha olyan kapcsolódó táblával rendelkezik, amely részletesebben van definiálva, mint a metrikát tartalmazó tábla, akkor ez a hiba jelenik meg. Példa:

  • Elemezheti, hogy mi készteti az ügyfeleket arra, hogy alacsony értékelést adjanak a szolgáltatásáról.
  • Szeretné megtudni, hogy az az eszköz, amelyen az ügyfél használja a szolgáltatást, befolyásolja-e az általuk adott véleményeket.
  • Az ügyfél többféleképpen is használhatja a szolgáltatást.
  • Az alábbi példában az 10000000 ügyfél böngészőt és táblagépet is használ a szolgáltatás használatához.

Screenshot of a related table defined at a more granular level than the table that contains your metric.

Ha az eszközoszlopot próbálja magyarázó tényezőként használni, a következő hibaüzenet jelenik meg:

Screenshot of wrong column error message.

Ez a hiba azért jelenik meg, mert az eszköz nincs ügyfélszinten definiálva. Egy ügyfél több eszközön is használhatja a szolgáltatást. Ahhoz, hogy a vizualizáció mintákat találjon, az eszköznek az ügyfél attribútumának kell lennie. Számos megoldás létezik, amelyek a vállalkozás megértésétől függnek:

  • Az eszközök összegzését megszámlálhatja. Használja például a darabszámot, ha az eszközök száma befolyásolhatja az ügyfél által megadott pontszámot.
  • Az eszközoszlop elforgatásával megállapíthatja, hogy a szolgáltatás adott eszközön való használata befolyásolja-e az ügyfél minősítését.

Ebben a példában az adatok kimutatása új oszlopokat hoz létre a böngésző, a mobil és a táblagép számára (az adatok elforgatása után törölje és hozza létre újra a kapcsolatokat a modellező nézetben). Most már használhatja ezeket az eszközöket a Magyarázó alkalmazásban. Minden eszközről kiderül, hogy befolyásolók, és a böngésző a legnagyobb hatással van az ügyfél pontszámára.

Pontosabban azok az ügyfelek, akik nem használják a böngészőt a szolgáltatás használatára, 3,79-szer nagyobb valószínűséggel adnak alacsony pontszámot, mint az ügyfelek. Lejjebb a listában, mobil esetén az inverz igaz. A mobilalkalmazást használó ügyfelek nagyobb valószínűséggel adnak alacsony pontszámot, mint azok az ügyfelek, akik nem.

Screenshot that shows mobile app are more likely to give a low score.

Figyelmeztetést látok, hogy a mértékek nem szerepelnek az elemzésemben. Miért?

Screenshot that shows measures not included error message.

Az elemzés az elemzett mező táblaszintjén fut. Ha elemzi az ügyfélváltozást, lehet, hogy van egy táblája, amely jelzi, hogy egy ügyfél át lett-e adva. Ebben az esetben az elemzés az ügyféltábla szintjén fut.

A mértékek és az összesítések alapértelmezés szerint a tábla szintjén vannak elemezve. Ha lenne egy mérték az átlagos havi kiadásokhoz, az az ügyféltábla szintjén lenne elemezve.

Ha az ügyféltábla nem rendelkezik egyedi azonosítóval, nem értékelheti ki a mértéket, és az elemzés figyelmen kívül hagyja. A helyzet elkerülése érdekében győződjön meg arról, hogy a metrika táblája egyedi azonosítóval rendelkezik. Ebben az esetben ez az ügyféltábla, az egyedi azonosító pedig az ügyfélazonosító. A Power Query használatával is könnyen felvehet indexoszlopot.

Figyelmeztetés jelenik meg, hogy az elemzett metrika több mint 10 egyedi értékkel rendelkezik, és ez az összeg befolyásolhatja az elemzés minőségét. Miért?

Az AI-vizualizáció kategorikus mezőket és numerikus mezőket elemezhet. Kategorikus mezők esetén előfordulhat például, hogy a forgalom igen vagy nem, az ügyfél-elégedettség pedig magas, közepes vagy alacsony. Az elemezni kívánt kategóriák számának növelése azt jelenti, hogy kategóriánként kevesebb megfigyelés van. Ez a helyzet megnehezíti, hogy a vizualizáció mintákat találjon az adatokban.

A numerikus mezők elemzésekor választhat a numerikus mezők (például szöveg) kezelése között, amely esetben ugyanazt az elemzést fogja futtatni, mint a kategorikus adatok esetében (kategorikus elemzés). Ha sok különböző értékkel rendelkezik, javasoljuk, hogy az elemzést folyamatos elemzésre váltsa, mivel ez azt jelenti, hogy a számok növekedéséből vagy csökkenéséből következtethetünk ahelyett, hogy különálló értékekként kezelnénk őket. A Kategorikus elemzésről folyamatos elemzésre válthat az Elemzés kártya Formázás paneljén.

Az erősebb befolyásolók megtalálásához javasoljuk, hogy a hasonló értékeket egyetlen egységbe csoportosítsa. Ha például rendelkezik egy ármetrikával, akkor valószínűleg jobb eredményeket érhet el, ha a hasonló árakat magas, közepes és alacsony kategóriákba csoportosítja, és az egyes árpontokat használja.

Screenshot that shows more than 10 unique factors warning.

Vannak olyan tényezők az adataimban, amelyek úgy néznek ki, mintha kulcsfontosságú befolyásolók lennének, de nem azok. Hogyan történhet ez meg?

Az alábbi példában a fogyasztók alacsony értékeléseket vezetnek, a minősítések 14,93%-a alacsony. A rendszergazdai szerepkör is nagy arányban alacsony értékeléseket, 13,42%, de ez nem tekinthető befolyásoló.

Ennek a meghatározásnak az az oka, hogy a vizualizáció az adatpontok számát is figyelembe veszi, amikor befolyásolókat talál. Az alábbi példában több mint 29 000 felhasználó és tízszer kevesebb rendszergazda van, körülbelül 2900. Közülük csak 390 adott alacsony értékelést. A vizualizáció nem rendelkezik elegendő adattal annak megállapításához, hogy rendszergazdai minősítéssel rendelkező mintát talált-e, vagy csak egy esélyt keres.

Screenshot that shows how influencers are determined.

Milyen adatpontkorlátok vonatkoznak a főbb befolyásolókra? Az elemzést 10 000 adatpontból álló mintán futtatjuk. Az egyik oldalon a buborékok az összes befolyásolót mutatják, amelyeket találtak. A másik oldalon lévő oszlopdiagramok és pontdiagramok betartják az alapvető vizualizációk mintavételezési stratégiáit.

Hogyan számíthatók ki a főbb befolyásolók a kategorikus elemzéshez?

A háttérben az AI-vizualizáció a ML.NET használatával futtat logisztikai regressziót a főbb befolyásolók kiszámításához. A logisztikai regresszió olyan statisztikai modell, amely különböző csoportokat hasonlít össze egymással.

Ha látni szeretné, hogy mi vezérli az alacsony értékeléseket, a logisztikai regresszió azt vizsgálja, hogy az alacsony pontszámot adó ügyfelek miben különböznek a magas pontszámot adó ügyfelektől. Ha több kategóriával rendelkezik, például magas, semleges és alacsony pontszámokkal, meg kell vizsgálnia, hogy az alacsony értékelést adó ügyfelek miben különböznek azoktól az ügyfelektől, akik nem adtak alacsony értékelést. Ebben az esetben miben különböznek az alacsony pontszámot adó ügyfelek azoktól az ügyfelektől, akik magas vagy semleges értékelést adtak?

A logisztikai regresszió mintázatokat keres az adatokban, és azt keresi, hogy az alacsony értékelést adó ügyfelek miben különbözhetnek a magas értékelést adó ügyfelektől. Előfordulhat például, hogy a több támogatási jeggyel rendelkező ügyfelek magasabb százalékban adnak alacsony minősítést, mint a kevés vagy nem támogatott jegyekkel rendelkező ügyfelek.

A logisztikai regresszió azt is figyelembe veszi, hogy hány adatpont található. Ha például a rendszergazdai szerepkörrel rendelkező ügyfelek arányosan több negatív pontszámot adnak, de csak néhány rendszergazda van, ez a tényező nem tekinthető befolyásosnak. Ezt a meghatározást azért kell meghatározni, mert nincs elegendő adatpont egy minta következtetéséhez. A statisztikai teszt, más néven Wald-teszt, annak meghatározására szolgál, hogy egy tényező befolyásolónak minősül-e. A vizualizáció p-értéke 0,05 a küszöbérték meghatározásához.

Hogyan számíthatók ki a főbb befolyásolók a numerikus elemzéshez?

A színfalak mögött az AI-vizualizáció a ML.NET használatával futtat lineáris regressziót a főbb befolyásolók kiszámításához. A lineáris regresszió egy statisztikai modell, amely a magyarázó tényezők alapján vizsgálja meg, hogy az elemzett mező milyen eredményt ad a változásoknak.

Ha például a lakásárakat elemezzük, a lineáris regresszió azt fogja vizsgálni, hogy a kiváló konyha milyen hatással lesz a lakásárakra. A kiváló konyhával rendelkező házak általában alacsonyabbak vagy magasabbak a házárakhoz képest, mint a kiváló konyha nélküli házak?

A lineáris regresszió az adatpontok számát is figyelembe veszi. Ha például a teniszpályákkal rendelkező házak magasabb árakkal rendelkeznek, de kevés teniszpályával rendelkező házunk van, ez a tényező nem tekinthető befolyásosnak. Ezt a meghatározást azért kell meghatározni, mert nincs elegendő adatpont egy minta következtetéséhez. A statisztikai teszt, más néven Wald-teszt, annak meghatározására szolgál, hogy egy tényező befolyásolónak minősül-e. A vizualizáció p-értéke 0,05 a küszöbérték meghatározásához.

Hogyan számítja ki a szegmenseket?

A színfalak mögött az AI-vizualizáció ML.NET használ a döntési fa futtatásához, hogy érdekes alcsoportokat találjon. A döntési fának az a célja, hogy olyan adatpontok alcsoportja legyen, amelyek viszonylag magasak az Ön számára fontos metrikában. Lehet, hogy alacsony minősítéssel rendelkező ügyfelek vagy magas árakkal rendelkező házak.

A döntési fa minden magyarázó tényezőt figyelembe vesz, és megpróbálja indokolni, hogy melyik tényező adja a legjobb felosztást. Ha például úgy szűri az adatokat, hogy csak nagyvállalati ügyfeleket tartalmazzon, az elkülöníti a magas értékelést és az alacsony értékelést adó ügyfeleket? Vagy talán jobb szűrni az adatokat, hogy csak azokat az ügyfeleket tartalmazza, akik megjegyzést fűztek a biztonsághoz?

A döntési fa felosztása után az adatok alcsoportját veszi fel, és meghatározza az adatok következő legjobb felosztását. Ebben az esetben az alcsoport az ügyfelek, akik megjegyzést fűztek a biztonsághoz. Az egyes felosztások után a döntési fa azt is figyelembe veszi, hogy elegendő adatponttal rendelkezik-e ahhoz, hogy ez a csoport elég reprezentatív legyen ahhoz, hogy mintát lehessen kikövetkeztetni az adatokból, vagy az adatok anomáliája, és nem valódi szegmens. Egy másik statisztikai tesztet alkalmazunk a felosztási feltétel statisztikai pontosságának ellenőrzésére 0,05 p-értékkel.

A döntési fa futása után az összes felosztást végrehajtja, például biztonsági megjegyzéseket és nagyvállalati beállításokat, és Power BI-szűrőket hoz létre. A szűrők e kombinációja szegmensként van csomagolva a vizualizációban.

Miért válnak bizonyos tényezők befolyásolókká, vagy miért nem lesznek befolyásolók, amikor több mezőt helyezek át a Magyarázat mező alapján ?

A vizualizáció az összes magyarázó tényezőt együtt értékeli ki. Egy tényező önmagában is befolyásoló lehet, de ha más tényezőkkel együtt tekintjük, előfordulhat, hogy nem. Tegyük fel, hogy azt szeretné elemezni, hogy mi hajtja a házárak magas, a hálószobák és a ház mérete magyarázó tényezők:

  • Önmagában több hálószoba lehet a vezető az ingatlanárak magas.
  • Ha beleszámítva a ház méretét az elemzésbe, az azt jelenti, hogy most megnézzük, mi történik a hálószobákkal, miközben a ház mérete állandó marad.
  • Ha a ház mérete 1500 négyzetméteren van rögzítve, nem valószínű, hogy a hálószobák számának folyamatos növekedése jelentősen növeli a ház árát.
  • Hálószobák nem lehet olyan fontos egy tényező, mint volt, mielőtt a ház méretét vették figyelembe.

A jelentés Power BI-munkatárssal való megosztásához mindkettőnek egyéni Power BI Pro-licencekkel kell rendelkeznie, vagy hogy a jelentés prémium szintű kapacitásban legyen mentve. Lásd a megosztási jelentéseket.