Tworzenie wizualizacji kluczowych elementów mających wpływ

DOTYCZY: program Power BI Desktop usługa Power BI

Wizualizacja kluczowych elementów mających wpływ pomaga zrozumieć czynniki, które napędzają metrykę, którą cię interesują. Analizuje dane, klasyfikuje istotne czynniki i wyświetla je jako kluczowe elementy mające wpływ. Załóżmy na przykład, że chcesz dowiedzieć się, co wpływa na obroty pracowników, co jest również nazywane rezygnacją. Jednym z czynników może być długość umowy o pracę, a inny czynnik może być czasem dojazdów.

Kiedy należy używać kluczowych elementów mających wpływ

Wizualizacja kluczowych elementów mających wpływ jest doskonałym wyborem, jeśli chcesz:

  • Zobacz, które czynniki wpływają na analizowane metryki.
  • Porównaj względne znaczenie tych czynników. Czy na przykład kontrakty krótkoterminowe wpływają na zmianę więcej niż kontrakty długoterminowe?

Funkcje wizualizacji kluczowych elementów mających wpływ

Screenshot of the numbered features of the key influencers visual.

  1. Karty: wybierz kartę, aby przełączać się między widokami. Kluczowe elementy mające wpływ zawierają najważniejsze współautory wybranej wartości metryki. Najważniejsze segmenty pokazują najważniejsze segmenty , które przyczyniają się do wybranej wartości metryki. Segment składa się z kombinacji wartości. Na przykład jeden segment może być konsumentami, którzy byli klientami przez co najmniej 20 lat i mieszkają w regionie zachodnim.

  2. Pole listy rozwijanej: wartość metryki badanej. W tym przykładzie przyjrzyj się metryce Ocena. Wybrana wartość to Niska.

  3. Restatement: ułatwia interpretowanie wizualizacji w okienku po lewej stronie.

  4. Okienko po lewej stronie: okienko po lewej stronie zawiera jedną wizualizację. W tym przypadku w okienku po lewej stronie zostanie wyświetlona lista najważniejszych kluczowych elementów mających wpływ.

  5. Restatement: Ułatwia interpretowanie wizualizacji w okienku po prawej stronie.

  6. Okienko po prawej stronie: okienko po prawej stronie zawiera jedną wizualizację. W tym przypadku wykres kolumnowy wyświetla wszystkie wartości kluczowego motywu mającego wpływ, który został wybrany w okienku po lewej stronie. Konkretna wartość użyteczności w okienku po lewej stronie jest wyświetlana na zielono. Wszystkie pozostałe wartości motywu są wyświetlane na czarno.

  7. Linia średnia: średnia jest obliczana dla wszystkich możliwych wartości motywu z wyjątkiem użyteczności (która jest wybranym elementem mającym wpływ). Dlatego obliczenie ma zastosowanie do wszystkich wartości w kolorze czarnym. Informuje o tym, jaki procent innych motywów miał niską ocenę. W tym przypadku 11,35% miało niską ocenę (pokazaną przez linię kropkowaną).

  8. Pole wyboru: Filtruje wizualizację w okienku po prawej stronie, aby wyświetlić tylko wartości mające wpływ dla tego pola. W tym przykładzie wizualizacja jest filtrowana w celu wyświetlania użyteczności, zabezpieczeń i nawigacji.

Analizowanie metryki podzielonej na kategorie

Obejrzyj to wideo, aby dowiedzieć się, jak utworzyć wizualizację kluczowych elementów mających wpływ przy użyciu metryki podzielonej na kategorie. Następnie wykonaj kroki, aby je utworzyć.

Uwaga

To wideo może używać wcześniejszych wersji programu Power BI Desktop lub usługa Power BI.

  1. Menedżer produktu chce ustalić, które czynniki prowadzą klientów do pozostawienia negatywnych opinii na temat usługi w chmurze. Aby wykonać czynności opisane w programie Power BI Desktop, otwórz plik PBIX Opinii o klientach.

Uwaga

Zestaw danych opinii klientów jest oparty na [Moro et al., 2014] S. Moro, P. Cortez i P. Rita. "Podejście oparte na danych do przewidywania sukcesu telemarketingu bankowego". Decision Support Systems, Elsevier, 62:22-31, czerwiec 2014.

  1. W obszarze Kompiluj wizualizację w okienku Wizualizacje wybierz ikonę Kluczowe elementy mające wpływ .

    Screenshot of the Key influencers icon on the Visualizations pane.

  2. Przenieś metryka, którą chcesz zbadać w polu Analizuj . Aby zobaczyć, co wpływa na niską ocenę klientów usługi, wybierz pozycję Ocena tabeli>klientów.

  3. Przenieś pola, które według Ciebie mogą mieć wpływ na ocenę w polu Wyjaśnij według . Możesz przenieść dowolną liczbę pól. W takim przypadku zacznij od:

    • Country-Region (Kraj–region)
    • Rola w organizacji
    • Typ subskrypcji
    • Rozmiar firmy
    • Theme
  4. Pozostaw puste pole Rozwiń według . To pole jest używane tylko podczas analizowania miary lub pola podsumowanego.

  5. Aby skoncentrować się na ocenach negatywnych, wybierz pozycję Niski w polu listy rozwijanej Co wpływa na ocenę .

    Screenshot of the drop-down box with high and low options.

Analiza jest uruchamiana na poziomie tabeli analizowanego pola. W tym przypadku jest to metryka Ocena . Ta metryka jest definiowana na poziomie klienta. Każdy klient otrzymał wysoką ocenę lub niską ocenę. Wszystkie czynniki objaśniające muszą być zdefiniowane na poziomie klienta, aby wizualizacja korzystała z nich.

W poprzednim przykładzie wszystkie czynniki objaśniające mają relację jeden do jednego lub wiele do jednego z metryką. W takim przypadku każdy klient przypisał do oceny pojedynczy motyw. Podobnie klienci pochodzą z jednego kraju lub regionu, mają jeden typ członkostwa i posiadają jedną rolę w swojej organizacji. Czynniki objaśniające są już atrybutami klienta i nie są potrzebne żadne przekształcenia. Wizualizacja może z nich korzystać natychmiast.

W dalszej części samouczka przyjrzysz się bardziej złożonym przykładom, które mają relacje jeden do wielu. W takich przypadkach kolumny muszą zostać najpierw zagregowane w dół do poziomu klienta, zanim będzie można uruchomić analizę.

Miary i agregacje używane jako czynniki objaśniające są również oceniane na poziomie tabeli metryki Analizuj . Niektóre przykłady przedstawiono w dalszej części tego artykułu.

Interpretowanie kluczowych elementów mających wpływ na kategorie

Przyjrzyjmy się kluczowym elementom mającym wpływ dla niskich ocen.

Najwyższy pojedynczy czynnik, który wpływa na prawdopodobieństwo niskiej oceny

Klient w tym przykładzie może mieć trzy role: konsument, administrator i wydawca. Bycie konsumentem jest głównym czynnikiem, który przyczynia się do niskiej oceny.

Screenshot of key influencers, with Role in Org is consumer selected.

Dokładniej mówiąc, użytkownicy są 2,57 razy bardziej skłonni do nadania usłudze negatywnego wyniku. Wykres kluczowych elementów mających wpływ zawiera listę Rola w organizacji jest najpierw użytkownik na liście po lewej stronie. Wybierając pozycję Rola w organizacji, usługa Power BI wyświetla więcej szczegółów w okienku po prawej stronie. Pokazano porównawczy wpływ każdej roli na prawdopodobieństwo niskiej oceny.

  • 14,93% konsumentów daje niski wynik.
  • Średnio wszystkie inne role dają niską ocenę 5,78% czasu.
  • Konsumenci są 2,57 razy bardziej skłonni do uzyskania niskiej oceny w porównaniu ze wszystkimi innymi rolami. Ten wynik można określić, dzieląc zielony pasek przez czerwoną linię kropkowaną.

Drugi pojedynczy czynnik, który wpływa na prawdopodobieństwo niskiej oceny

Wizualizacja kluczowych elementów mających wpływ porównuje i klasyfikuje czynniki z wielu różnych zmiennych. Drugi element mający wpływ nie ma nic wspólnego z rolą w organizacji. Wybierz drugi element mający wpływ na liście, czyli Temat jest użyteczność.

Screenshot of key influencers, with Theme is usability selected.

Drugi najważniejszy czynnik jest związany z tematem przeglądu klienta. Klienci, którzy skomentowali użyteczność produktu, byli 2,55 razy bardziej skłonni do uzyskania niskiej oceny w porównaniu do klientów, którzy skomentowali inne tematy, takie jak niezawodność, projektowanie lub szybkość.

Między wizualizacjami średnia, która jest wyświetlana przez czerwoną linię kropkowaną, zmieniła się z 5,78% na 11,35%. Średnia jest dynamiczna, ponieważ jest oparta na średniej wszystkich innych wartości. Dla pierwszego elementu mającego wpływ średnia wykluczyła rolę klienta. W przypadku drugiego elementu mającego wpływ wykluczył motyw użyteczności.

Zaznacz pole wyboru Pokaż tylko wartości, które mają wpływ, aby filtrować przy użyciu tylko wartości wpływowych. W takim przypadku są to role, które mają niski wynik. 12 motywów jest zredukowanych do czterech, które usługa Power BI zidentyfikowała jako motywy, które napędzają niskie oceny.

Screenshot of check box to only show values that are influencers.

Interakcja z innymi wizualizacjami

Za każdym razem, gdy wybierzesz fragmentator, filtr lub inną wizualizację na kanwie, wizualizacja kluczowych elementów mających wpływ ponownie uruchomi analizę nowej części danych. Możesz na przykład przenieść rozmiar firmy do raportu i użyć go jako fragmentatora. Użyj go, aby sprawdzić, czy kluczowe elementy mające wpływ dla klientów korporacyjnych różnią się od ogólnej populacji. Wielkość firmy w przedsiębiorstwie jest większa niż 50 000 pracowników.

Wybierz >50 000 , aby ponownie uruchomić analizę i zobaczysz, że elementy mające wpływ uległy zmianie. W przypadku dużych klientów korporacyjnych głównym elementem mającym wpływ na niską ocenę jest temat związany z zabezpieczeniami. Warto dokładniej zbadać, czy istnieją konkretne funkcje zabezpieczeń, o których klienci są niezadowoleni.

Screenshot of visual to select by company size.

Interpretowanie ciągłych kluczowych elementów mających wpływ

Do tej pory pokazano, jak za pomocą wizualizacji dowiedzieć się, jak różne pola podzielone na kategorie wpływają na niskie oceny. Istnieje również możliwość posiadania ciągłych czynników, takich jak wiek, wzrost i cena w polu Wyjaśnij według . Przyjrzyjmy się, co się stanie, gdy czas użytkowania zostanie przeniesiony z tabeli klienta do obszaru Wyjaśnij według. Czas użytkowania przedstawia, jak długo klient korzystał z usługi.

W miarę zwiększania się czasu użytkowania prawdopodobieństwo otrzymania niższej oceny również wzrasta. Ten trend sugeruje, że długoterminowi klienci są bardziej skłonni do uzyskania negatywnego wyniku. Ta analiza jest interesująca i warto kontynuować później.

Wizualizacja pokazuje, że za każdym razem, gdy czas użytkowania wzrasta o 13,44 miesięcy, średnio prawdopodobieństwo niskiej oceny zwiększa się o 1,23 razy. W tym przypadku 13,44 miesięcy przedstawia odchylenie standardowe kadencji. Więc szczegółowe informacje, które otrzymujesz, przyglądają się zwiększeniu czasu użytkowania przez standardową kwotę, która jest odchyleniem standardowym czasu użytkowania, wpływa na prawdopodobieństwo otrzymania niskiej oceny.

Wykres punktowy w okienku po prawej stronie kreśli średnią wartość procentową niskich ocen dla każdej wartości kadencji. Wyróżnia nachylenie z linią trendu.

Screenshot of scatter plot for Tenure.

Binned ciągłe kluczowe elementy mające wpływ

W niektórych przypadkach może się okazać, że czynniki ciągłe zostały automatycznie przekształcone w kategorie. Jeśli relacja między zmiennymi nie jest liniowa, nie możemy opisać relacji jako po prostu rosnącej lub malejącej (tak jak w powyższym przykładzie).

Uruchamiamy testy korelacji, aby określić, jak liniowy element mający wpływ jest w odniesieniu do celu. Jeśli element docelowy jest ciągły, uruchamiamy korelację Pearson, a jeśli element docelowy jest podzielony na kategorie, uruchamiamy testy korelacji punktów biserycznych. Jeśli wykryjemy, że relacja nie jest wystarczająco liniowa, przeprowadzamy nadzorowane kwantowanie i generujemy maksymalnie pięć pojemników. Aby ustalić, które pojemniki mają najwięcej sensu, użyjemy nadzorowanej metody kwantowania, która analizuje relację między czynnikiem objaśniającym a analizą docelową.

Interpretowanie miar i agregacji jako kluczowych elementów mających wpływ

Miary i agregacje można używać jako czynników objaśniających wewnątrz analizy. Możesz na przykład zobaczyć, jaki wpływ ma liczba biletów pomocy technicznej klienta lub średni czas trwania otwartego biletu na otrzymany wynik.

W takim przypadku chcesz sprawdzić, czy liczba biletów pomocy technicznej, które klient ma na podstawie podanej oceny. Teraz dodasz identyfikator biletu pomocy technicznej z tabeli biletów pomocy technicznej. Ponieważ klient może mieć wiele biletów pomocy technicznej, należy zagregować identyfikator na poziomie klienta. Agregacja jest ważna, ponieważ analiza jest uruchamiana na poziomie klienta, dlatego wszystkie sterowniki muszą być zdefiniowane na tym poziomie szczegółowości.

Przyjrzyjmy się liczbie identyfikatorów. Każdy wiersz klienta ma skojarzona liczbę biletów pomocy technicznej. W takim przypadku, w miarę wzrostu liczby biletów pomocy technicznej, prawdopodobieństwo niskiej oceny wzrasta o 4,08 razy. Wizualizacja po prawej stronie pokazuje średnią liczbę biletów pomocy technicznej według różnych wartości klasyfikacji ocenianych na poziomie klienta.

Screenshot that shows influence of Support Ticket ID.

Interpretowanie wyników: najważniejsze segmenty

Możesz użyć karty Kluczowe elementy mające wpływ, aby ocenić każdy czynnik indywidualnie. Możesz również użyć karty Najważniejsze segmenty , aby zobaczyć, jak kombinacja czynników wpływa na analizną metrykę.

Pierwsze segmenty początkowo przedstawiają przegląd wszystkich segmentów odnalezionych przez usługę Power BI. W poniższym przykładzie pokazano, że znaleziono sześć segmentów. Te segmenty są klasyfikowane według procentu niskich ocen w segmencie. Na przykład segment 1 ma 74,3% ocen klientów, które są niskie. Im wyższy bąbelek, tym wyższy odsetek niskich ocen. Rozmiar bąbelka reprezentuje liczbę klientów w segmencie.

Screenshot of Top segments tab selected.

Wybranie bąbelka powoduje wyświetlenie szczegółów tego segmentu. Jeśli na przykład wybierzesz segment 1, okaże się, że składa się on z stosunkowo ustalonych klientów. Byli klientami od ponad 29 miesięcy i mają ponad cztery bilety pomocy technicznej. Na koniec nie są wydawcami, więc są konsumentami lub administratorami.

W tej grupie 74,3% klientów wystawiło niską ocenę. Średni klient wystawił niską ocenę 11,7% czasu, więc ten segment ma większy odsetek niskich ocen. Jest to 63 punkty procentowe wyższe. Segment 1 zawiera również około 2,2% danych, więc reprezentuje adresową część populacji.

Screenshot of top segment according to rating.

Dodawanie liczby

Czasami element mający wpływ może mieć znaczący wpływ, ale reprezentuje niewiele danych. Na przykład temat to użyteczność jest trzecim co do wielkości elementem mającym wpływ na niskie oceny. Jednak może istnieć tylko garstka klientów, którzy skarżyli się na użyteczność. Liczby mogą pomóc w określaniu priorytetów elementów mających wpływ, na których chcesz się skupić.

Liczbę można włączyć za pomocą karty Analiza okienka formatowania.

Screenshot of enable counts slider in the Format pane.

Po włączeniu liczby zobaczysz pierścień wokół bąbelka każdego elementu mającego wpływ, który reprezentuje przybliżony procent danych, które zawierają elementy mające wpływ. Więcej bąbelków pierścienia, tym więcej danych zawiera. Widzimy, że temat jest użyteczność zawiera niewielką część danych.

Screenshot of rings that around influencer bubbles that represent counts.

Możesz również użyć przełącznika Sortuj według w lewym dolnym rogu wizualizacji, aby posortować bąbelki według liczby zamiast wpływu. Typ subskrypcji to Premier jest głównym elementem mającym wpływ na podstawie liczby.

Screenshot of the Sort by toggle to sort by counts first.

Posiadanie pełnego pierścienia wokół okręgu oznacza, że element mający wpływ zawiera 100% danych. Możesz zmienić typ liczby na względny do maksymalnego elementu mającego wpływ, korzystając z listy rozwijanej Liczba typów na karcie Analiza okienka formatowania. Teraz element mający wpływ z największą ilością danych będzie reprezentowany przez pełny pierścień, a wszystkie inne liczby będą względem niego względne.

Screenshot that shows the relative counts drop-down menu.

Analizowanie metryki, która jest liczbowa

Jeśli przeniesiesz niesumaryzowane pole liczbowe do pola Analizuj , możesz wybrać sposób obsługi tego scenariusza. Zachowanie wizualizacji można zmienić, przechodząc do okienka formatowania i przełączając się między typem analizy kategorialnej a typem analizy ciągłej.

Screenshot of drop-down menu to change from categorical to continuous.

Typ analizy kategorii zachowuje się zgodnie z powyższym opisem. Jeśli na przykład patrzysz na wyniki ankiety z zakresu od 1 do 10, możesz zapytać "Co wpływa na wyniki ankiety 1?".

Typ analizy ciągłej zmienia pytanie na ciągły. W powyższym przykładzie nowe pytanie brzmi: "Co wpływa na wyniki ankiety w celu zwiększenia/zmniejszenia?".

To rozróżnienie jest przydatne, gdy masz wiele unikatowych wartości w analizowym polu. W poniższym przykładzie przyjrzymy się cenom domów. Nie ma znaczenia, aby zapytać "Co wpływa na cenę domu być 156,214?". ponieważ jest to bardzo specyficzne i prawdopodobnie nie będziemy mieli wystarczającej ilości danych, aby wywnioskować wzorzec.

Zamiast tego możemy zapytać: "Co wpływa na wzrost ceny domu"? pozwala nam traktować ceny domów jako zakres, a nie odrębne wartości.

Screenshot of drop-down options to choose influencers.

Interpretowanie wyników: Kluczowe elementy mające wpływ

Uwaga

Przykłady w tej sekcji korzystają z danych dotyczących cen domu w domenie publicznej. Jeśli chcesz kontynuować, możesz pobrać przykładowy zestaw danych .

W tym scenariuszu przyjrzymy się "Co wpływa na wzrost ceny domu". Wiele czynników objaśniających może mieć wpływ na cenę domu, takich jak Year Built (rok, w której został zbudowany dom), KitchenQual (jakość kuchni) i YearRemodAdd (rok, w której dom został przebudowany).

W poniższym przykładzie przyjrzymy się naszemu głównemu elementowi mającemu wpływ, który jest jakością kuchni jest doskonała. Wyniki są podobne do tych, które widzieliśmy podczas analizowania metryk kategorii z kilkoma ważnymi różnicami:

  • Wykres kolumnowy po prawej stronie analizuje średnie, a nie wartości procentowe. Dlatego pokazuje nam, jaka jest średnia cena domu z doskonałą kuchnią (zielony bar) w porównaniu do średniej ceny domu domu bez doskonałej kuchni (linia kropkowana)
  • Liczba w bąbelku jest nadal różnicą między czerwoną linią kropkowaną a zielonym paskiem, ale jest wyrażona jako liczba ($158.49K), a nie prawdopodobieństwo (1,93x). Więc średnio domy z doskonałymi kuchniami są prawie 160 000 dolarów droższe niż domy bez doskonałych kuchni.

Screenshot of numeric target categorical influencers.

W poniższym przykładzie przyjrzymy się wpływowi współczynnika ciągłego (dom w roku został przebudowany) w cenie domu. Różnice w porównaniu z analizą ciągłych elementów mających wpływ dla metryk kategorii są następujące:

  • Wykres punktowy w okienku po prawej stronie kreśli średnią cenę domu dla każdej odrębnej wartości roku przebudowy.
  • Wartość w bąbelku pokazuje, ile średnia cena domu wzrasta (w tym przypadku 2,87 tys.), kiedy rok dom został przebudowany zwiększa się o odchylenie standardowe (w tym przypadku 20 lat)

Screenshot of numeric target continuous influencers.

Na koniec, w przypadku miar, patrzymy na średni rok budowy domu. Analiza jest następująca:

  • Wykres punktowy w okienku po prawej stronie kreśli średnią cenę domu dla każdej odrębnej wartości w tabeli
  • Wartość w bąbelku pokazuje, ile średnia cena domu wzrasta (w tym przypadku 1,35 tys.), gdy średni rok wzrasta o odchylenie standardowe (w tym przypadku 30 lat)

Screenshot of Key influencers for house prices with influencers on the left and the scatterplot on the right.

Interpretowanie wyników: najważniejsze segmenty

Najważniejsze segmenty dla celów liczbowych pokazują grupy, w których średnie ceny domów są wyższe niż w ogólnym zestawie danych. Na przykład poniżej widać, że segment 1 składa się z domów, w których GarażCars (liczba samochodów, które może zmieścić się w garażu) jest większa niż 2, a RoofStyle to Hip. Domy o tych cechach mają średnią cenę $355K w porównaniu do ogólnej średniej w danych, która wynosi 180 000 USD.

Screenshot that shows Top segments for house prices.

Analizowanie metryki, która jest miarą lub kolumną podsumowaną

W przypadku miary lub kolumny podsumowanej analiza jest domyślnie ustawiona na typ analizy ciągłej opisany powyżej. Nie można zmienić tej wartości. Największą różnicą między analizowaniem kolumny miary/podsumowania a niesumaryzowaną kolumną liczbową jest poziom, na którym jest uruchamiana analiza.

W przypadku kolumn niesumaryzowanych analiza zawsze jest uruchamiana na poziomie tabeli. W powyższym przykładzie ceny domu przeanalizowaliśmy metrykę Cena domu, aby zobaczyć, co wpływa na cenę domu w celu zwiększenia/spadku. Analiza jest uruchamiana automatycznie na poziomie tabeli. Nasza tabela ma unikatowy identyfikator dla każdego domu, więc analiza jest uruchamiana na poziomie domu.

Screenshot that shows the table level analysis for the house price example.

W przypadku miar i podsumowanych kolumn nie wiemy od razu, na jakim poziomie należy je analizować. Jeśli cena domu została podsumowana jako średnia, musimy rozważyć, jaki poziom chcielibyśmy obliczyć tę średnią cenę domu. Czy jest to średnia cena domu na poziomie sąsiedztwa? A może na poziomie regionalnym?

Miary i kolumny podsumowane są automatycznie analizowane na poziomie używanego pola Wyjaśnij według . Załóżmy, że mamy trzy pola w temacie Wyjaśnij według: Jakość kuchni, Typ budynku i Klimatyzacja. Średnia cena domu zostanie obliczona dla każdej unikatowej kombinacji tych trzech pól. Często warto przełączyć się do widoku tabeli, aby sprawdzić, jak wyglądają oceniane dane.

Screenshot that shows the three columns and the average house price.

Ta analiza jest bardzo podsumowana i dlatego trudno będzie modelowi regresji znaleźć wszelkie wzorce w danych, z których może się uczyć. Powinniśmy uruchomić analizę na bardziej szczegółowym poziomie, aby uzyskać lepsze wyniki. Jeśli chcemy przeanalizować cenę domu na poziomie domu, musimy jawnie dodać pole identyfikatora do analizy. Niemniej jednak nie chcemy, aby identyfikator domu był traktowany jako element mający wpływ. Nie warto dowiedzieć się, że w miarę wzrostu identyfikatora domu cena domu wzrasta. Opcja dobrze rozwiń według pola przydaje się tutaj. Możesz użyć opcji Rozwiń według , aby dodać pola, których chcesz użyć do ustawiania poziomu analizy bez wyszukiwania nowych elementów mających wpływ.

Zobacz, jak wygląda wizualizacja po dodaniu identyfikatora do obszaru Rozwiń według. Po zdefiniowaniu poziomu, na którym miara ma zostać obliczona, interpretacja elementów mających wpływ jest dokładnie taka sama jak w przypadku kolumn liczbowych bez zasumowania.

Screenshot that shows the house price visualization that depends on the three columns discussed in this section.

Jeśli chcesz dowiedzieć się więcej o sposobie analizowania miar za pomocą wizualizacji kluczowych elementów mających wpływ, obejrzyj poniższy film wideo. Aby dowiedzieć się, jak usługa Power BI używa ML.NET za kulisami do wnioskowania o danych i uzyskiwaniu wglądu w szczegółowe dane w naturalny sposób, zobacz Usługa Power BI identyfikuje kluczowe elementy mające wpływ przy użyciu ML.NET.

Uwaga

To wideo może używać wcześniejszych wersji programu Power BI Desktop lub usługa Power BI.

Zagadnienia i rozwiązywanie problemów

Jakie są ograniczenia dotyczące wizualizacji?

Wizualizacja kluczowych elementów mających wpływ ma pewne ograniczenia:

  • Zapytanie bezpośrednie nie jest obsługiwane
  • Obsługa Połączenie na żywo w usługach Azure Analysis Services i SQL Server Analysis Services nie jest obsługiwana
  • Publikowanie w internecie nie jest obsługiwane
  • Wymagany jest program .NET Framework 4.6 lub nowszy
  • Osadzanie w usłudze SharePoint Online nie jest obsługiwane

Screenshot of drop-down choices for numeric question

Widzę błąd, że nie znaleziono żadnych elementów mających wpływ ani segmentów. Dlaczego?

Screenshot of no influencers found error message.

Ten błąd występuje, gdy dołączono pola w obszarze Wyjaśnij według , ale nie znaleziono elementów mających wpływ.

  • Metryka, którą analizowano, została uwzględniona zarówno w obszarze Analizuj, jak i Wyjaśnij według. Usuń go z obszaru Wyjaśnij według.
  • Pola objaśniające mają zbyt wiele kategorii z kilkoma obserwacjami. Ta sytuacja utrudnia wizualizacji ustalenie, które czynniki mają wpływ. Trudno uogólnić tylko kilka obserwacji. Jeśli analizujesz pole liczbowe, możesz przełączyć się z analizy kategorialnej na analizę ciągłą w okienku formatowania na karcie Analiza.
  • Czynniki objaśniające mają wystarczającą liczbę obserwacji, aby uogólnić, ale wizualizacja nie znalazła żadnych znaczących korelacji do raportowania.

Widzę błąd, że analizna metryka nie ma wystarczającej ilości danych do uruchomienia analizy. Dlaczego?

Screenshot of not enough data error message.

Wizualizacja działa, przeglądając wzorce w danych dla jednej grupy w porównaniu z innymi grupami. Na przykład szuka klientów, którzy wystawili niskie oceny w porównaniu z klientami, którzy wystawili wysokie oceny. Jeśli dane w modelu mają tylko kilka obserwacji, wzorce są trudne do znalezienia. Jeśli wizualizacja nie ma wystarczającej ilości danych do znalezienia znaczących elementów mających wpływ, oznacza to, że do uruchomienia analizy jest potrzebnych więcej danych.

Zalecamy wykonanie co najmniej 100 obserwacji dla wybranego stanu. W tym przypadku stanem są klienci, którzy rezygnują. Potrzebujesz również co najmniej 10 obserwacji dla stanów używanych do porównania. W tym przypadku stan porównania to klienci, którzy nie rezygnują.

Jeśli analizujesz pole liczbowe, możesz przełączyć się z analizy kategorialnej na analizę ciągłą w okienku formatowania na karcie Analiza.

Widzę błąd, że gdy "Analiza" nie jest podsumowana, analiza zawsze jest uruchamiana na poziomie wiersza tabeli nadrzędnej. Zmiana tego poziomu za pomocą pól "Rozwiń według" jest niedozwolona. Dlaczego?

Podczas analizowania kolumny liczbowej lub podzielonej na kategorie analiza zawsze jest uruchamiana na poziomie tabeli. Jeśli na przykład analizujesz ceny domów, a tabela zawiera kolumnę ID, analiza zostanie automatycznie uruchomiona na poziomie identyfikatora domu.

Podczas analizowania miary lub kolumny podsumowanej musisz jawnie stwierdzić, na jakim poziomie chcesz, aby analiza została uruchomiona. Możesz użyć polecenia Rozwiń według , aby zmienić poziom analizy miar i podsumowanych kolumn bez dodawania nowych elementów mających wpływ. Jeśli cena domu została zdefiniowana jako miara, możesz dodać kolumnę identyfikatora domu do rozwiń , aby zmienić poziom analizy.

Widzę błąd, że pole w obszarze Wyjaśnij według nie jest unikatowo powiązane z tabelą zawierającą analizowane metryki. Dlaczego?

Analiza jest uruchamiana na poziomie tabeli analizowanego pola. Na przykład w przypadku analizowania opinii klientów dotyczących usługi może istnieć tabela, która informuje, czy klient wystawił wysoką ocenę, czy niską ocenę. W takim przypadku analiza jest uruchamiana na poziomie tabeli klienta.

Jeśli masz powiązaną tabelę zdefiniowaną na bardziej szczegółowym poziomie niż tabela zawierająca metrykę, zostanie wyświetlony ten błąd. Oto przykład:

  • Analizujesz, co wpływa na to, że klienci mają niskie oceny usługi.
  • Chcesz sprawdzić, czy urządzenie, na którym klient korzysta z twojej usługi, wpływa na podane recenzje.
  • Klient może korzystać z usługi na wiele różnych sposobów.
  • W poniższym przykładzie klient 10000000 używa przeglądarki i tabletu do interakcji z usługą.

Screenshot of a related table defined at a more granular level than the table that contains your metric.

Jeśli spróbujesz użyć kolumny urządzenia jako czynnik objaśniający, zostanie wyświetlony następujący błąd:

Screenshot of wrong column error message.

Ten błąd pojawia się, ponieważ urządzenie nie jest zdefiniowane na poziomie klienta. Jeden klient może korzystać z usługi na wielu urządzeniach. Aby wizualizacja znalazła wzorce, urządzenie musi być atrybutem klienta. Istnieje kilka rozwiązań, które zależą od zrozumienia firmy:

  • Możesz zmienić podsumowanie urządzeń, aby je zliczać. Na przykład użyj liczby, jeśli liczba urządzeń może mieć wpływ na ocenę, którą podaje klient.
  • Możesz przestawienia kolumny urządzenia, aby sprawdzić, czy korzystanie z usługi na określonym urządzeniu wpływa na ocenę klienta.

W tym przykładzie dane zostały przestawne w celu utworzenia nowych kolumn dla przeglądarki, urządzeń przenośnych i tabletów (upewnij się, że usuniesz i ponownie utworzysz relacje w widoku modelowania po przestawienia danych). Teraz możesz używać tych konkretnych urządzeń w temacie Wyjaśnij według. Wszystkie urządzenia okazują się elementami mającymi wpływ, a przeglądarka ma największy wpływ na ocenę klienta.

Dokładniej mówiąc, klienci, którzy nie korzystają z przeglądarki do korzystania z usługi, są 3,79 razy bardziej skłonni do uzyskania niskiej oceny niż klienci, którzy to robią. W dolnej części listy dla urządzeń przenośnych odwrotność jest prawdziwa. Klienci korzystający z aplikacji mobilnej są bardziej skłonni do uzyskania niskiej oceny niż klienci, którzy tego nie robią.

Screenshot that shows mobile app are more likely to give a low score.

Widzę ostrzeżenie, że miary nie zostały uwzględnione w mojej analizie. Dlaczego?

Screenshot that shows measures not included error message.

Analiza jest uruchamiana na poziomie tabeli analizowanego pola. Jeśli analizujesz współczynnik zmian klientów, może istnieć tabela, która informuje o tym, czy klient zrezygnował, czy nie. W takim przypadku analiza jest uruchamiana na poziomie tabeli klienta.

Miary i agregacje są domyślnie analizowane na poziomie tabeli. Gdyby istniała miara średniego miesięcznego wydatków, zostanie ona przeanalizowana na poziomie tabeli klienta.

Jeśli tabela klienta nie ma unikatowego identyfikatora, nie możesz ocenić miary i jest ona ignorowana przez analizę. Aby uniknąć tej sytuacji, upewnij się, że tabela z metryką ma unikatowy identyfikator. W takim przypadku jest to tabela klienta, a unikatowy identyfikator to identyfikator klienta. Można również łatwo dodać kolumnę indeksu przy użyciu dodatku Power Query.

Widzę ostrzeżenie, że analizna metryka ma więcej niż 10 unikatowych wartości i że ta kwota może mieć wpływ na jakość mojej analizy. Dlaczego?

Wizualizacja sztucznej inteligencji może analizować pola kategorii i pola liczbowe. W przypadku pól kategorii przykładem może być wartość Churn to Tak lub Nie, a zadowolenie klientów to Wysoki, Średni lub Niski. Zwiększenie liczby kategorii do przeanalizowania oznacza, że liczba obserwacji na kategorię jest mniejsza. Taka sytuacja utrudnia wizualizacji znajdowanie wzorców w danych.

Podczas analizowania pól liczbowych możesz wybrać między traktowaniem pól liczbowych, takich jak tekst, w którym przypadku uruchomisz tę samą analizę, co w przypadku danych kategorii (analiza kategorii). Jeśli masz wiele odrębnych wartości, zalecamy przełączenie analizy na analizę ciągłą , co oznacza, że możemy wywnioskować wzorce, gdy liczby rosną lub zmniejszają, zamiast traktować je jako odrębne wartości. Możesz przełączyć się z analizy kategorialnej na analizę ciągłą w okienku formatowania na karcie Analiza .

Aby znaleźć silniejsze elementy mające wpływ, zalecamy grupowanie podobnych wartości w jedną jednostkę. Jeśli na przykład masz metrykę dla ceny, prawdopodobnie uzyskasz lepsze wyniki, grupując podobne ceny na kategorie Wysokie, Średnie i Niskie w porównaniu z użyciem poszczególnych punktów cenowych.

Screenshot that shows more than 10 unique factors warning.

W moich danych istnieją czynniki, które wyglądają tak, jakby były kluczowymi elementami mającymi wpływ, ale tak nie są. Jak to się stanie?

W poniższym przykładzie klienci, którzy są konsumentami, mają niskie oceny, z 14,93% ocen, które są niskie. Rola administratora ma również wysoki odsetek niskich ocen na poziomie 13,42%, ale nie jest uważany za element mający wpływ.

Przyczyną tej determinacji jest to, że wizualizacja uwzględnia również liczbę punktów danych w przypadku znalezienia elementów mających wpływ. Poniższy przykład ma ponad 29 000 użytkowników i 10 razy mniej administratorów, około 2900. Tylko 390 z nich dało niską ocenę. Wizualizacja nie ma wystarczającej ilości danych, aby określić, czy znalazła wzorzec z ocenami administratorów, czy jest to tylko szansa znalezienia.

Screenshot that shows how influencers are determined.

Jakie są limity punktów danych dla kluczowych elementów mających wpływ? Przeprowadzamy analizę na próbce 10 000 punktów danych. Bąbelki po jednej stronie pokazują wszystkie znalezione elementy mające wpływ. Wykresy kolumnowe i wykresy punktowe po drugiej stronie są zgodne ze strategiami próbkowania dla tych podstawowych wizualizacji.

Jak obliczyć kluczowe elementy mające wpływ na potrzeby analizy kategorii?

W tle wizualizacja sztucznej inteligencji używa ML.NET do uruchamiania regresji logistycznej w celu obliczenia kluczowych elementów mających wpływ. Regresja logistyczna to model statystyczny, który porównuje ze sobą różne grupy.

Jeśli chcesz zobaczyć, co napędza niską ocenę, regresja logistyczna sprawdza, w jaki sposób klienci, którzy dali niską ocenę, różnią się od klientów, którzy wystawili wysoki wynik. Jeśli masz wiele kategorii, takich jak wysokie, neutralne i niskie wyniki, przyjrzyj się, jak klienci, którzy wystawili niską ocenę, różnią się od klientów, którzy nie wystawili niskiej oceny. W takim przypadku, jak klienci, którzy dali niską ocenę, różnią się od klientów, którzy wystawili wysoką ocenę lub neutralną ocenę?

Regresja logistyczna wyszukuje wzorce w danych i szuka, w jaki sposób klienci, którzy wystawili niską ocenę, mogą różnić się od klientów, którzy wystawili wysoką ocenę. Może się na przykład okazać, że klienci z większą liczbą biletów pomocy technicznej dają wyższy procent niskich ocen niż klienci z kilkoma biletami pomocy technicznej lub bez nich.

Regresja logistyczna uwzględnia również liczbę punktów danych. Jeśli na przykład klienci, którzy pełnią rolę administratora, dają proporcjonalnie więcej negatywnych wyników, ale istnieje tylko kilku administratorów, ten czynnik nie jest uważany za wpływowy. Ta determinacja jest dokonana, ponieważ nie ma wystarczającej liczby dostępnych punktów danych, aby wywnioskować wzorzec. Test statystyczny, znany jako test Wald, służy do określenia, czy czynnik jest uważany za element mający wpływ. Wizualizacja używa wartości p 0,05, aby określić próg.

Jak obliczyć kluczowe elementy mające wpływ na potrzeby analizy liczbowej?

W tle wizualizacja sztucznej inteligencji używa ML.NET do uruchamiania regresji liniowej w celu obliczenia kluczowych elementów mających wpływ. Regresja liniowa to model statystyczny, który analizuje wynik pola analizowany na podstawie czynników objaśniających.

Jeśli na przykład analizujemy ceny domów, regresja liniowa przyjrzy się efektowi, który będzie miał doskonałą kuchnię w cenie domu. Czy domy z doskonałymi kuchniami zazwyczaj mają niższe lub wyższe ceny domów w porównaniu do domów bez doskonałych kuchni?

Regresja liniowa uwzględnia również liczbę punktów danych. Jeśli na przykład domy z kortami tenisowymi mają wyższe ceny, ale mamy kilka domów z kortem tenisowym, ten czynnik nie jest uważany za wpływowy. Ta determinacja jest dokonana, ponieważ nie ma wystarczającej liczby dostępnych punktów danych, aby wywnioskować wzorzec. Test statystyczny, znany jako test Wald, służy do określenia, czy czynnik jest uważany za element mający wpływ. Wizualizacja używa wartości p 0,05, aby określić próg.

Jak obliczasz segmenty?

W tle wizualizacja sztucznej inteligencji używa ML.NET do uruchamiania drzewa decyzyjnego w celu znalezienia interesujących podgrup. Celem drzewa decyzyjnego jest zakończenie podgrupy punktów danych, które są stosunkowo wysokie w metryce, którą cię interesują. Może to być klienci o niskich ocenach lub domach o wysokich cenach.

Drzewo decyzyjne przyjmuje każdy czynnik objaśniający i próbuje uzasadnić, który czynnik daje mu najlepszy podział. Jeśli na przykład przefiltrujesz dane tak, aby obejmowały tylko dużych klientów korporacyjnych, czy oddzieli to klientów, którzy wystawili wysoką ocenę w porównaniu z niską oceną? A może lepiej filtrować dane, aby uwzględnić tylko klientów, którzy skomentowali zabezpieczenia?

Po podzieleniu drzewa decyzyjnego przyjmuje podgrupę danych i określa następny najlepszy podział dla tych danych. W takim przypadku podgrupa to klienci, którzy komentowali zabezpieczenia. Po każdym podziale drzewo decyzyjne uwzględnia również, czy ma wystarczająco dużo punktów danych, aby ta grupa była wystarczająco reprezentatywna, aby wywnioskować wzorzec z lub czy jest to anomalia w danych, a nie rzeczywisty segment. Stosuje się kolejny test statystyczny w celu sprawdzenia istotności statystycznej warunku podziału z wartością p 0,05.

Po zakończeniu działania drzewa decyzyjnego wszystkie podziały, takie jak komentarze zabezpieczeń i duże przedsiębiorstwo, i tworzy filtry usługi Power BI. Ta kombinacja filtrów jest spakowana jako segment w wizualizacji.

Dlaczego niektóre czynniki stają się elementami mającymi wpływ lub przestają być elementami mającymi wpływ, gdy przenosim więcej pól do pola Wyjaśnij według ?

Wizualizacja ocenia wszystkie czynniki objaśniające razem. Czynnikiem może być sam element mający wpływ, ale jeśli jest brany pod uwagę z innymi czynnikami, może to nie być. Załóżmy, że chcesz przeanalizować, co napędza wysoką cenę domu, z sypialniami i rozmiarem domu jako czynniki objaśniające:

  • Sama w sobie, więcej sypialni może być czynnikiem dla cen domów, aby być wysokie.
  • Uwzględnienie wielkości domu w analizie oznacza, że teraz patrzysz na to, co dzieje się z sypialniami, podczas gdy rozmiar domu pozostaje stały.
  • Jeśli rozmiar domu jest stały na 1500 stóp kwadratowych, jest mało prawdopodobne, że ciągły wzrost liczby sypialni znacznie zwiększy cenę domu.
  • Sypialnie mogą nie być tak ważne, jak to było przed rozważenia wielkości domu.

Udostępnianie raportu współpracownikowi usługi Power BI wymaga posiadania indywidualnych licencji usługi Power BI Pro lub zapisania raportu w pojemności Premium. Zobacz udostępnianie raportów.