Stosowanie technik klastrowania

Ukończone

Klastrowanie umożliwia zidentyfikowanie segmentów (klastrów) danych, które są podobne do siebie, ale niepodobne do pozostałych danych. Proces klastrowania różni się od zastosowanego wcześniej procesu grupowania.

Funkcja klastrowania usługi Power BI umożliwia szybkie znajdowanie grup z podobnymi punktami danych w podzestawie danych. Analizuje ona model semantyczny w celu zidentyfikowania podobieństw i niezgodności w wartościach atrybutów, a następnie oddziela dane, które mają podobieństwa do podzestawu danych. Te podzestawy danych są określane jako klastry.

Możesz na przykład szukać wzorców w danych sprzedaży, pokazujących ogólne zachowanie klientów. W tym celu możesz podzielić klientów na klastry na podstawie podobieństw między nimi, na przykład wieku lub lokalizacji.

Zacznij od dodania do raportu wizualizacji wykresu punktowego, a następnie dodaj do niej wymagane pola. W tym przykładzie dodasz pole Order Qty do osi x, pole Sales (Sprzedaż ) do osi y i Unit Price (Cena jednostkowa ) do pola Values (Wartości ). Na poniższej ilustracji widać, że na wykresie punktowym znajduje się dużo danych, więc trudno jest rozpoznać jakiekolwiek naturalne grupy.

Zrzut ekranu przedstawiający wykres punktowy z nazwami produktów.

Aby zastosować klastrowanie do wykresu punktowego, wybierz pozycję Więcej opcji (...) w prawym górnym rogu wizualizacji, a następnie wybierz pozycję Automatycznie wyszukuj klastry.

W wyświetlonym oknie Klastry można edytować domyślną nazwę, pole i opis, jeśli jest to wymagane. Jednak w tym przykładzie chcesz zmienić liczbę klastrów. Jak widać na poniższej ilustracji, pole Liczba klastrów jest domyślnie puste, co oznacza, że usługa Power BI automatycznie określi liczbę klastrów, która powinna być optymalna dla konkretnych danych.

Zrzut ekranu przedstawiający ustawienia domyślne w oknie Klastry.

Wprowadź w tym polu własną liczbę klastrów (3), a następnie wybierz pozycję OK. W usłudze Power BI zostanie uruchomiony algorytm klastrowania i zostanie utworzone nowe pole kategorii z inną liczbą grup klastrów. Teraz, gdy spojrzysz na wizualizację, możesz wyraźniej zobaczyć klastry, które znajdują się w danych, i przystąpić do ich analizy.

Zrzut ekranu przedstawiający klastrowanie zastosowane do wykresu punktowego.

Nowe pole klastra jest dodawane do zasobnika selektora pól Legenda wykresu punktowego i można go teraz użyć jako źródła wyróżniania krzyżowego podobnie jak każdego innego pola w obszarze Legenda. Nowe pole klastra jest też wyświetlane na liście pól i można go używać w nowych wizualizacjach, podobnie jak każdego innego pola.

Jeśli chcesz edytować klaster, kliknij prawym przyciskiem myszy pole klastra i wybierz polecenie Edytuj klastry.

Zrzut ekranu przedstawiający widok edycji klastrów dla pozycji Nazwa produktu (klastry).

W powyższym przykładzie po zastosowaniu klastrowania do wykresu punktowego można było skorzystać tylko z dwóch miar. Jeśli chcesz znajdować klastry, używając więcej niż dwóch miar, możesz zamiast tego użyć wizualizacji tabeli, dodać wszystkie pola, których chcesz użyć, a następnie uruchomić algorytm klastrowania tak samo, jak w powyższym procesie.