Stosowanie szczegółowych informacji w usłudze Power BI, aby dowiedzieć się, gdzie rozkłady się różnią

Artykuł
09/08/2023

DOTYCZY: program Power BI Desktop usługa Power BI

Często w wizualizacjach widać punkt danych i zastanawiasz się, czy dystrybucja byłaby taka sama dla różnych kategorii. Korzystając ze szczegółowych informacji w usłudze Power BI , możesz znaleźć tylko kilka kliknięć.

Rozważmy następującą wizualizację, która pokazuje totalSales by CountryName. Większość sprzedaży pochodzi z Stany Zjednoczone, co stanowi 57% całej sprzedaży z mniejszym wkładem pochodzącym z innych krajów/regionów. W takich przypadkach często warto sprawdzić, czy ten sam rozkład będzie widoczny dla różnych podpopulacji. Czy na przykład jest to takie samo dla wszystkich lat, wszystkich kanałów sprzedaży i wszystkich kategorii produktów? Chociaż można zastosować różne filtry i porównać wyniki wizualnie, może to być czasochłonne i podatne na błędy. Screenshot of a chart with a big distribution.

Możesz poinformować usługę Power BI , aby dowiedzieć się, gdzie jest inna dystrybucja, oraz szybko, zautomatyzować i analizować szczegółowe dane. Kliknij prawym przyciskiem myszy punkt danych i wybierz pozycję Analizuj>znajdź, gdzie ta dystrybucja jest inna, a szczegółowe informacje są dostarczane w łatwym do użycia oknie.

Screenshot of an insight, showing a different distribution.

W tym przykładzie automatyczna analiza pokazuje, że odsetek sprzedaży dla touring bikes w Stany Zjednoczone i Kanadzie jest niższy niż odsetek pochodzący z innych krajów/regionów.

Użycie szczegółowych informacji

Aby użyć szczegółowych informacji, aby dowiedzieć się, gdzie rozkłady widoczne na wykresach są różne, wystarczy kliknąć prawym przyciskiem myszy dowolny punkt danych lub wizualizację jako całość. Następnie wybierz pozycję Analizuj>, gdzie ta dystrybucja jest inna.

Screenshot of a Column chart, showing a right click menu.

Usługa Power BI uruchamia algorytmy uczenia maszynowego na danych. Następnie wypełnia okno wizualizacją i opisem kategorii (kolumn) oraz wartościami tych kategorii, które powodują najbardziej znacząco różną dystrybucję. Szczegółowe informacje są udostępniane jako wykres kolumnowy, jak pokazano na poniższej ilustracji:

Screenshot showing a Column chart and an insight.

Wartości z zastosowanym wybranym filtrem mają domyślny kolor. Ogólne wartości, jak pokazano na oryginalnej wizualizacji początkowej, są wyświetlane w kolorze szarym w celu łatwego porównania. W tym przykładzie można uwzględnić maksymalnie trzy różne filtry (Touring Bikes, Mountain Bikes i Road Bikes), a w tym przykładzie można wybrać różne filtry, wybierając punkt danych lub używając klawiszy Ctrl-click, aby wybrać wiele.

W przypadku prostych miar addytywnych, takich jak Total Sales w tym przykładzie, porównanie jest oparte na wartościach względnych, a nie bezwzględnych. Sprzedaż dla touring bikes jest niższa niż ogólna sprzedaż dla wszystkich kategorii; Jednak wizualizacja domyślnie używa podwójnej osi, aby umożliwić porównanie proporcji sprzedaży w różnych krajach/regionach. Dotyczy to rowerów Touring Bikes i wszystkich kategorii rowerów. Przełączenie przełącznika poniżej wizualizacji umożliwia wyświetlanie dwóch wartości na tej samej osi, co umożliwia łatwe porównywanie wartości bezwzględnych, jak pokazano na poniższej ilustracji:

Screenshot showing a visual with an insight.

Tekst opisowy wskazuje również poziom ważności, który może być dołączony do wartości filtru, biorąc pod uwagę liczbę rekordów pasujących do filtru. W tym przykładzie widać, że podczas gdy dystrybucja rowerów touringowych może być inna, stanowią one tylko 16,6% rekordów.

Ikony kciuków w górę i kciuk w dół w górnej części strony istnieją, dzięki czemu możesz przekazać opinię na temat wizualizacji i funkcji. Jednak nie wytrenuje algorytmu tak, aby wpływał na wyniki zwrócone przy następnym użyciu funkcji.

Co ważne, + przycisk w górnej części wizualizacji umożliwia dodanie wybranej wizualizacji do raportu tak, jakby wizualizacja została utworzona ręcznie. Następnie możesz sformatować lub dostosować dodaną wizualizację tak samo jak dowolną inną wizualizację w raporcie. Możesz dodać tylko wybraną wizualizację szczegółowych informacji podczas edytowania raportu w usłudze Power BI.

Możesz użyć szczegółowych informacji, gdy raport jest w trybie odczytu lub edycji. To sprawia, że jest wszechstronny zarówno do analizowania danych, jak i tworzenia wizualizacji, które można dodawać do raportów.

Szczegóły zwróconych wyników

Algorytm można traktować jako biorąc wszystkie inne kolumny w modelu i, dla wszystkich wartości tych kolumn, stosując je jako filtry do oryginalnej wizualizacji. Następnie algorytm znajduje, które z tych wartości filtru generuje najbardziej inny wynik od oryginalnego.

Prawdopodobnie zastanawiasz się, co innego oznacza. Załóżmy na przykład, że ogólny podział sprzedaży między USA a Kanadą jest następujący:

Kraj/region	Sprzedaż ($M)
USA	15
Kanada	5

Następnie w przypadku określonej kategorii produktu "Road Bike" podział sprzedaży może być:

Kraj/region	Sprzedaż ($M)
USA	3
Kanada	1

Chociaż liczby są różne w każdej z tych tabel, względne wartości między USA i Kanadą są identyczne: 75% i 25% ogólnej i dla Road Bikes. W związku z tym nie są one uważane za inne. W przypadku prostych miar addytywnych, algorytm szuka różnic w wartości względnej.

Z kolei rozważmy miarę podobną do marży obliczonej jako Zysk/koszt. Jeśli ogólne marże dla USA i Kanady były następujące:

Kraj/region	Margines (%)
USA	15
Kanada	5

Następnie w przypadku określonej kategorii produktu "Road Bike" podział sprzedaży może być:

Kraj/region	Margines (%)
USA	3
Kanada	1

Biorąc pod uwagę charakter takich miar, jest to interesujące inaczej. W przypadku miar nie addytywnych, takich jak ten przykład marginesu, algorytm szuka różnic w wartości bezwzględnej.

Wyświetlane wizualizacje mają na celu pokazanie różnic między ogólną dystrybucją, jak pokazano w oryginalnej wizualizacji, a wartością z zastosowanym określonym filtrem.

W przypadku miar addytywnych, takich jak Sales w poprzednim przykładzie, jest używany wykres kolumnowy i liniowy. W tym miejscu użycie podwójnej osi z odpowiednim skalowaniem jest takie, że można porównać wartości względne. Kolumny pokazują wartość z zastosowanym filtrem, a wiersz pokazuje ogólną wartość. Oś kolumny znajduje się po lewej stronie, a oś linii znajduje się po prawej stronie, jak zwykle. Linia jest wyświetlana przy użyciu stylu schodkowego z kreskowaną linią wypełnioną szarością. W poprzednim przykładzie, jeśli maksymalna wartość osi kolumny wynosi 4, a maksymalna wartość osi linii wynosi 20, pozwoli to na łatwe porównanie wartości względnych między USA a Kanadą dla filtrowanych i ogólnych wartości.

Podobnie w przypadku miar innych niż addytywne, takich jak margines w poprzednim przykładzie, jest używany wykres kolumnowy i liniowy, gdzie użycie jednej osi oznacza, że wartości bezwzględne można łatwo porównać. Linia wypełniona kolorem szarym pokazuje ogólną wartość. Czy porównywanie liczb rzeczywistych lub względnych, określenie stopnia, w jakim dwa rozkłady są różne, nie jest po prostu kwestią obliczania różnicy w wartościach. Na przykład:

Gdy wielkość populacji jest uwzględniana, różnica jest mniej znacząca statystycznie i mniej interesująca, gdy ma zastosowanie do mniejszej części ogólnej populacji. Na przykład dystrybucja sprzedaży między krajami/regionami może być inna dla określonego produktu. Nie byłoby to interesujące, gdyby były tysiące produktów, więc dany produkt stanowił tylko niewielki procent ogólnej sprzedaży.
Różnice w tych kategoriach, w których oryginalne wartości były wysokie lub zbliżone do zera, są ważone wyżej niż inne. Na przykład jeśli ogólny kraj lub region przyczynia się tylko do 1% sprzedaży, ale dla określonego typu produktu przyczynia się do 6%, jest to bardziej istotne statystycznie, a zatem bardziej interesujące, niż kraj lub region, którego wkład zmienił się z 50% do 55%.
Różne heurystyki wybierają na przykład najbardziej znaczące wyniki, biorąc pod uwagę inne relacje między danymi.

Po zbadaniu różnych kolumn i wartości dla każdej z tych kolumn wybierany jest zestaw wartości, które dają największe różnice. Aby ułatwić zrozumienie, są to dane wyjściowe i pogrupowane według kolumny z kolumną, której wartości dają największą różnicę wymienioną jako pierwsza. Wyświetlane są maksymalnie trzy wartości w kolumnie, ale mniej może być wyświetlanych, jeśli istnieje mniej niż trzy wartości, które mają duży wpływ, lub jeśli niektóre wartości mają znacznie większy wpływ niż inne.

Niekoniecznie jest tak, że wszystkie kolumny w modelu zostaną zbadane w dostępnym czasie, więc nie ma gwarancji, że są wyświetlane najbardziej istotne kolumny i wartości. Jednak różne heurystyki zapewniają, że najprawdopodobniej kolumny zostaną zbadane jako pierwsze. Załóżmy na przykład, że po zbadaniu wszystkich kolumn ustali się, że następujące kolumny/wartości mają największy wpływ na rozkład, od największego wpływu na najmniej:

Subcategory = Touring Bikes
Channel = Direct
Subcategory = Mountain Bikes
Subcategory = Road Bikes
Subcategory = Kids Bikes
Channel = Store

Będą one uzyskiwać dane wyjściowe w kolejności kolumn w następujący sposób:

Podkategoria: Touring Bikes, Mountain Bikes, Road Bikes (tylko trzy wymienione, z tekstem: "... między innymi", aby wskazać, że więcej niż trzy mają znaczący wpływ)
Channel = Direct (tylko bezpośredni na liście, jeśli jej poziom wpływu był większy niż Sklep)

Rozważania i ograniczenia

Poniższa lista to kolekcja aktualnie nieobsługiwanych scenariuszy dotyczących szczegółowych informacji:

Filtry TopN
Filtry miar
Miary nieliczbowe
Użycie opcji "Pokaż wartość jako"
Miary filtrowane — przefiltrowane miary to obliczenia na poziomie wizualizacji z zastosowanym określonym filtrem, na przykład Łączna sprzedaż dla Francji i są używane w niektórych wizualizacjach utworzonych przez funkcję szczegółowych informacji

Ponadto następujące typy modeli i źródła danych nie są obecnie obsługiwane w przypadku szczegółowych informacji:

DirectQuery
Połączenie na żywo
Lokalne usługi Reporting Services
Osadzanie

Aby uzyskać więcej informacji, zobacz:

Stosowanie szczegółowych informacji w usłudze Power BI, aby dowiedzieć się, gdzie rozkłady się różnią

Użycie szczegółowych informacji

Szczegóły zwróconych wyników

Rozważania i ograniczenia

Powiązana zawartość

Dodatkowe zasoby