Dela via


Använda insikter i Power BI för att identifiera var distributionerna varierar

GÄLLER FÖR: Power BI Desktop-Power BI-tjänst

Ofta i visuella objekt ser du en datapunkt och undrar om fördelningen skulle vara densamma för olika kategorier. Med insikter i Power BI kan du ta reda på det med bara några få klick.

Överväg följande visuella objekt, som visar TotalSales efter CountryName. Merparten av försäljningen kommer från USA och står för 57 % av all försäljning med mindre bidrag från andra länder/regioner. Det är ofta intressant i sådana fall att undersöka om samma fördelning skulle ses för olika underpopulationer. Är detta till exempel detsamma för alla år, alla försäljningskanaler och alla produktkategorier? Du kan använda olika filter och jämföra resultaten visuellt, men det kan vara tidskrävande och felbenäget. Screenshot of a chart with a big distribution.

Du kan be Power BI att ta reda på var en distribution skiljer sig och få snabb, automatiserad och insiktsfull analys av dina data. Högerklicka på en datapunkt och välj Analysera>Hitta var den här distributionen skiljer sig och en insikt levereras till dig i ett lätthanterad fönster.

Screenshot of an insight, showing a different distribution.

I det här exemplet visar den automatiserade analysen att andelen försäljning för Touring Bikes i USA och Kanada är lägre än andelen som kommer från de andra länderna/regionerna.

Använd insikter

Om du vill använda insikter för att ta reda på var distributioner som visas i diagram skiljer sig åt högerklickar du bara på en datapunkt eller på det visuella objektet som helhet. Välj sedan Analysera>Hitta var den här fördelningen skiljer sig.

Screenshot of a Column chart, showing a right click menu.

Power BI kör sina maskininlärningsalgoritmer över data. Sedan fylls ett fönster med ett visuellt objekt och en beskrivning av vilka kategorier (kolumner) och vilka värden i dessa kategorier som resulterar i den mest signifikant olika fördelningen. Insikter tillhandahålls som ett stapeldiagram, som visas i följande bild:

Screenshot showing a Column chart and an insight.

Värdena med det valda filtret har standardfärgen. De övergripande värdena, som visas i det ursprungliga visuella startobjektet, visas i grått för enkel jämförelse. Upp till tre olika filter kan ingå (Touring Bikes, Mountain Bikes och Road Bikes i det här exemplet) och olika filter kan väljas genom att välja en datapunkt eller genom att ctrl-klicka för att välja flera.

För enkla additiva mått, till exempel Total försäljning i det här exemplet, baseras jämförelsen på de relativa, snarare än absoluta, värdena. Försäljningen för Touring Bikes är lägre än den totala försäljningen för alla kategorier. Det visuella objektet använder dock som standard en dubbel axel för att göra det möjligt att jämföra försäljningsandelen mellan olika länder/regioner. Detta är för Touring Bikes jämfört med alla kategorier av cyklar. Genom att växla under det visuella objektet kan de två värdena visas på samma axel, vilket gör att de absoluta värdena enkelt kan jämföras, vilket visas i följande bild:

Screenshot showing a visual with an insight.

Den beskrivande texten anger också vilken prioritetsnivå som kan kopplas till ett filtervärde, med tanke på antalet poster som matchar filtret. I det här exemplet ser du att även om fördelningen för Touring Bikes kan vara annorlunda, så står de bara för 16,6 % av posterna.

Ikonerna tummen upp och tummen ned överst på sidan finns så att du kan ge feedback om det visuella objektet och funktionen. Men om du gör det tränas inte algoritmen att påverka resultatet som returneras nästa gång du använder funktionen.

Med knappen överst + i det visuella objektet kan du lägga till det valda visuella objektet i rapporten som om du skapade det visuella objektet manuellt. Du kan sedan formatera eller justera det tillagda visuella objektet precis som för andra visuella objekt i rapporten. Du kan bara lägga till ett markerat visuellt insiktsobjekt när du redigerar en rapport i Power BI.

Du kan använda insikter när rapporten är i läs- eller redigeringsläge. Detta gör det mångsidigt för både analys av data och för att skapa visuella objekt som du kan lägga till i dina rapporter.

Information om de returnerade resultaten

Du kan se algoritmen som att ta alla andra kolumner i modellen och, för alla värden i dessa kolumner, tillämpa dem som filter på det ursprungliga visuella objektet. Algoritmen hittar sedan vilket av dessa filtervärden som ger det mest annorlunda resultatet från originalet.

Du undrar förmodligen vad olika betyder. Anta till exempel att den totala uppdelningen av försäljningen mellan USA och Kanada är följande:

Land/region Försäljning ($M)
USA 15
Kanada 5

För en viss kategori av produkten "Road Bike" kan uppdelningen av försäljningen vara:

Land/region Försäljning ($M)
USA 3
Kanada 1

Även om talen skiljer sig åt i var och en av dessa tabeller är de relativa värdena mellan USA och Kanada identiska: 75 % och 25 % totalt och för Road Bikes. Därför anses dessa inte vara annorlunda. För enkla additiva mått som detta letar algoritmen efter skillnader i det relativa värdet.

Tänk dig däremot ett mått som marginalen beräknad som Vinst/Kostnad. Om de totala marginalerna för USA och Kanada var följande:

Land/region Marginal (%)
USA 15
Kanada 5

För en viss kategori av produkten "Road Bike" kan uppdelningen av försäljningen vara:

Land/region Marginal (%)
USA 3
Kanada 1

Med tanke på sådana åtgärders art är detta intressant annorlunda. För icke-additiva mått som det här marginalexemplet letar algoritmen efter skillnader i det absoluta värdet.

De visuella objekt som visas är därför avsedda att visa skillnaderna mellan den övergripande fördelningen, som visas i det ursprungliga visuella objektet, och värdet med det specifika filtret tillämpat.

För additiva mått, till exempel Försäljning i föregående exempel, används ett kolumn- och linjediagram. Där är användningen av en dubbel axel med lämplig skalning sådan att de relativa värdena kan jämföras. Kolumnerna visar värdet med filtret tillämpat och raden visar det övergripande värdet. Kolumnaxeln är till vänster och linjeaxeln är till höger som vanligt. Linjen visas med ett stegvis format, med en streckad linje, fylld med grått. I föregående exempel, om kolumnaxelns maxvärde är 4 och det maximala värdet för linjeaxeln är 20, skulle det göra det enkelt att jämföra de relativa värdena mellan USA och Kanada för de filtrerade och övergripande värdena.

På samma sätt används ett kolumn- och linjediagram för icke-additiva mått som marginal i föregående exempel, där användningen av en enskild axel innebär att de absoluta värdena enkelt kan jämföras. Raden fylld med grå visar det övergripande värdet. Oavsett om du jämför faktiska eller relativa tal är bestämningen av i vilken grad två fördelningar skiljer sig inte bara en fråga om att beräkna skillnaden i värdena. Till exempel:

  • När populationens storlek räknas in är en skillnad mindre statistiskt signifikant och mindre intressant när den gäller för en mindre andel av den totala populationen. Till exempel kan fördelningen av försäljningen mellan länder/regioner skilja sig åt för en viss produkt. Detta skulle inte vara intressant om det fanns tusentals produkter, så den specifika produkten stod bara för en liten andel av den totala försäljningen.

  • Skillnader för de kategorier där de ursprungliga värdena var höga eller nära noll viktas högre än andra. Om ett land eller en region totalt sett endast bidrar med 1 % av försäljningen, men för en viss typ av produkt bidrar med 6 %, är det mer statistiskt signifikant och därför mer intressant än ett land eller en region vars bidrag har ändrats från 50 % till 55 %.

  • Olika heuristiker väljer till exempel de mest meningsfulla resultaten genom att överväga andra relationer mellan data.

När du har undersökt olika kolumner och värdena för var och en av dessa kolumner väljs den uppsättning värden som ger de största skillnaderna. För att underlätta förståelsen är dessa sedan utdata och grupperade efter kolumn, med kolumnen vars värden ger den största skillnaden som anges först. Upp till tre värden visas per kolumn, men mindre kan visas antingen om det finns färre än tre värden som har en stor effekt eller om vissa värden är mycket mer effektfulla än andra.

Det är inte nödvändigtvis så att alla kolumner i modellen kommer att undersökas under den tid som är tillgänglig, så det är inte säkert att de mest effektfulla kolumnerna och värdena visas. Olika heuristiker säkerställer dock att de mest sannolika kolumnerna granskas först. Anta till exempel att när du har undersökt alla kolumner är det fastställt att följande kolumner/värden har störst inverkan på fördelningen, från mest påverkan till minst:

Subcategory = Touring Bikes
Channel = Direct
Subcategory = Mountain Bikes
Subcategory = Road Bikes
Subcategory = Kids Bikes
Channel = Store

Dessa skulle få utdata i kolumnordning enligt följande:

  • Underkategori: Touring Bikes, Mountain Bikes, Road Bikes (endast tre listade, med texten inklusive "... "för att indikera att fler än tre har en betydande inverkan)

  • Channel = Direct (endast Direkt i listan, om dess effektnivå var större än Store)

Beaktanden och begränsningar

Följande lista är samlingen med scenarier som för närvarande inte stöds för insikter:

  • TopN-filter
  • Måttfilter
  • Icke-numeriska mått
  • Användning av "Visa värde som"
  • Filtrerade mått – filtrerade mått är beräkningar på visuell nivå med ett specifikt filter som tillämpas, till exempel Total försäljning för Frankrike, och används på några av de visuella objekt som skapats av insiktsfunktionen

Dessutom stöds för närvarande inte följande modelltyper och datakällor för insikter:

  • DirectQuery
  • Live-anslutning
  • Lokala Reporting Services
  • Bädda in

Mer information finns i: