Grupowanie lub podsumowywanie wierszy

W dodatku Power Query można grupować wartości w różnych wierszach w jedną wartość, grupując wiersze według wartości w co najmniej jednej kolumnie. Można wybrać spośród dwóch typów operacji grupowania:

  • Grupowania kolumn.

  • Grupowania wierszy.

W tym samouczku użyjesz poniższej przykładowej tabeli.

Przykładowa tabela początkowa.

Tabela z kolumnami z kolumnami Year (2020), Country (USA, Panama lub Canada), Product (Shirt lub Shorts), Sales channel (Online lub Reseller) i Units (różne wartości z zakresu od 55 do 7500)

Gdzie znaleźć przycisk Grupuj według

Przycisk Grupuj według można znaleźć w trzech miejscach:

  • Na karcie Narzędzia główne w grupie Przekształć.

    Grupuj według na karcie Narzędzia główne.

  • Na karcie Przekształć w grupie Tabela.

    Grupuj według na karcie Przekształć.

  • W menu skrótów po kliknięciu prawym przyciskiem myszy, aby wybrać kolumny.

    Grupuj według w menu skrótów.

Używanie funkcji agregującej do grupowania według co najmniej jednej kolumny

W tym przykładzie twoim celem jest podsumowanie łącznej liczby sprzedanych jednostek na poziomie kraju i kanału sprzedaży. Użyjesz kolumn Country (Kraj ) i Sales Channel (Kanał sprzedaży), aby wykonać grupę według operacji.

  1. Wybierz pozycję Grupuj według na karcie Narzędzia główne .
  2. Wybierz opcję Zaawansowane, aby wybrać wiele kolumn do grupowania.
  3. Wybierz kolumnę Country (Kraj ).
  4. Wybierz pozycję Dodaj grupowanie.
  5. Wybierz kolumnę Sales Channel (Kanał sprzedaży).
  6. W polu Nazwa nowej kolumny wprowadź wartość Total units (Całkowita liczba jednostek) w obszarze Operation (Operacja), wybierz pozycję Sum (Suma) i w polu Column (Kolumna) wybierz pozycję Units (Jednostki).
  7. Wybierz OK

Grupuj według okna dialogowego z zagregowanymi kolumnami.

Ta operacja zawiera poniższą tabelę.

Przykładowa tabela danych wyjściowych z kolumnami Country (Kraj), Sales Channel (Kanał sprzedaży) i Total units (Łączna liczba jednostek).

Dostępne operacje

Dzięki funkcji Grupuj według dostępne operacje można podzielić na dwa sposoby:

  • Operacja na poziomie wiersza
  • Operacja na poziomie kolumny

W poniższej tabeli opisano każdą z tych operacji.

Nazwa operacji Kategoria opis
Sum Operacja kolumny Sumuje wszystkie wartości z kolumny
Średnia Operacja kolumny Oblicza średnią wartość z kolumny
Mediana Operacja kolumny Oblicza medianę z kolumny
Min Operacja kolumny Oblicza minimalną wartość z kolumny
Maksimum Operacja kolumny Oblicza maksymalną wartość z kolumny
Percentyl Operacja kolumny Oblicza percentyl przy użyciu wartości wejściowej od 0 do 100 z kolumny
Zlicz unikatowe wartości Operacja kolumny Oblicza liczbę unikatowych wartości z kolumny
Zlicz wiersze Operacja wiersza Oblicza całkowitą liczbę wierszy z danej grupy
Zlicz unikatowe wiersze Operacja wiersza Oblicza liczbę odrębnych wierszy z danej grupy
Wszystkie wiersze Operacja wiersza Zwraca wszystkie zgrupowane wiersze w wartości tabeli bez agregacji

Uwaga

Liczba unikatowych wartości i operacji percentylu są dostępne tylko w usłudze Power Query Online.

Wykonywanie operacji grupowania według co najmniej jednej kolumny

Począwszy od oryginalnego przykładu, w tym przykładzie utworzysz kolumnę zawierającą łączną liczbę jednostek i dwie inne kolumny, które dają nazwę i jednostki sprzedawane dla produktu o najwyższej wydajności, podsumowane na poziomie kraju i kanału sprzedaży.

Przykładowa tabela danych wyjściowych z operacjami.

  1. Użyj następujących kolumn jako Grupuj według kolumn:

    • Kraj
    • Kanał sprzedaży
  2. Utwórz dwie nowe kolumny, wykonując następujące kroki:

    1. Agregowanie kolumny Units (Jednostki) przy użyciu operacji Sum (Suma). Nadaj tej kolumnie nazwę Total units (Całkowita liczba jednostek).
    2. Dodaj nową kolumnę Products przy użyciu operacji Wszystkie wiersze .

    Grupuj według okna dialogowego z kolumną niegregowaną.

Po zakończeniu tej operacji zwróć uwagę, że kolumna Products zawiera wartości [Table] wewnątrz każdej komórki. Każda wartość [Tabela] zawiera wszystkie wiersze pogrupowane według kolumn Country (Kraj ) i Sales Channel (Kanał sprzedaży) z oryginalnej tabeli. W komórce możesz wybrać biały znak, aby wyświetlić podgląd zawartości tabeli w dolnej części okna dialogowego.

Okienko podglądu szczegółów tabeli.

Uwaga

Okienko podglądu szczegółów może nie zawierać wszystkich wierszy używanych do operacji grupowania. Możesz wybrać wartość [Tabela], aby wyświetlić wszystkie wiersze odnoszące się do odpowiedniej operacji grupowania.

Następnie należy wyodrębnić wiersz o najwyższej wartości w kolumnie Units (Jednostki) tabel w nowej kolumnie Products (Produkty) i wywołać tę nową kolumnę Produkt o najwyższej wydajności.

Wyodrębnianie informacji o produkcie o najwyższej wykonawców

Nowa kolumna Products (Produkty) z wartościami [Table] umożliwia utworzenie nowej kolumny niestandardowej, przechodząc do karty Dodaj kolumnę na wstążce i wybierając pozycję Kolumna niestandardowa z grupy Ogólne.

Dodaj kolumnę niestandardową.

Nadaj nowej kolumnie nazwę top performer product. Wprowadź formułę Table.Max([Products], "Units" ) w obszarze Formuła kolumny niestandardowej.

Formuła kolumny niestandardowej z tabelą Table.Max.

Wynik tej formuły tworzy nową kolumnę z wartościami [Record]. Te wartości rekordów są zasadniczo tabelą z tylko jednym wierszem. Te rekordy zawierają wiersz z maksymalną wartością kolumny Units (Jednostki) każdej wartości [Table] w kolumnie Products (Produkty).

Wynik formuły kolumny niestandardowej z tabelą Table.Max.

Po wykonaniu tej nowej kolumny produktu o najwyższej wydajności zawierającejRozwiń. wartości [Rekord] możesz wybrać ikonę rozwijania, wybrać pola Product and Units (Produkty i jednostki), a następnie wybrać przycisk OK.

Rozwiń operację dla wartości rekordu w kolumnie Produkt top performer.

Po usunięciu kolumny Products i ustawieniu typu danych dla obu nowo rozwiniętych kolumn wynik będzie podobny do poniższego obrazu.

Końcowa tabela ze wszystkimi przekształceniami.

Grupowanie rozmyte

Uwaga

Poniższa funkcja jest dostępna tylko w usłudze Power Query Online.

Aby zademonstrować sposób "grupowania rozmytego", rozważ przykładową tabelę pokazaną na poniższej ilustracji.

Tabela z dziewięcioma wierszami wpisów, które zawierają różne pisownie i litery nazwy Miguel i William.

Celem grupowania rozmytego jest wykonywanie operacji grupowania według, która używa przybliżonego algorytmu dopasowania dla ciągów tekstowych. Dodatek Power Query używa algorytmu podobieństwa Jaccard do mierzenia podobieństwa między parami wystąpień. Następnie stosuje klastry hierarchiczne agglomeracyjne do grupowania wystąpień razem. Na poniższej ilustracji przedstawiono oczekiwane dane wyjściowe, w których tabela zostanie pogrupowana według kolumny Person .

Tabela przedstawiająca pozycje Person jako

Aby wykonać grupowanie rozmyte, wykonaj te same kroki opisane wcześniej w tym artykule. Jedyną różnicą jest to, że tym razem w oknie dialogowym Grupuj według zaznacz pole wyboru Użyj grupowania rozmytego.

Pole wyboru Grupowanie rozmyte w oknie dialogowym Grupuj według.

Dla każdej grupy wierszy dodatek Power Query wybierze najczęściej używane wystąpienie jako wystąpienie "kanoniczne". Jeśli wystąpi wiele wystąpień z tą samą częstotliwością, dodatek Power Query wybierze pierwszy z nich. Po wybraniu przycisku OK w oknie dialogowym Grupuj według otrzymasz oczekiwany wynik.

Przykładowa tabela końcowa grupowania rozmytego, bez tabeli przekształcania.

Jednak masz większą kontrolę nad operacją grupowania rozmytego, rozwijając opcje grupy Rozmyte.

Opcje grupy rozmyte.

Dostępne są następujące opcje grupowania rozmyte:

  • Próg podobieństwa (opcjonalnie): Ta opcja wskazuje, jak podobne dwie wartości muszą być zgrupowane razem. Ustawienie minimalnej wartości 0 spowoduje zgrupowanie wszystkich wartości. Ustawienie maksymalne 1 będzie zezwalać tylko na grupowanie wartości, które dokładnie pasują do siebie. Wartość domyślna to 0,8.
  • Ignoruj wielkość liter: podczas porównywania ciągów tekstowych wielkość liter zostanie zignorowana. Ta opcja jest domyślnie włączona.
  • Grupuj, łącząc części tekstowe: algorytm spróbuje połączyć części tekstowe (takie jak łączenie mikro i miękkie w firmie Microsoft) w celu grupowania wartości.
  • Pokaż wyniki podobieństwa: Pokaż wyniki podobieństwa między wartościami wejściowymi a obliczonymi wartościami reprezentatywnymi po grupowaniu rozmyte. Wymaga dodania operacji, takiej jak Wszystkie wiersze , aby zaprezentować te informacje na poziomie wiersza po wierszu.
  • Tabela przekształceń (opcjonalnie): możesz wybrać tabelę przekształceń, która będzie mapować wartości (takie jak mapowanie msFT na firmę Microsoft), aby grupować je razem.

W tym przykładzie zostanie użyta tabela przekształceń, aby zademonstrować sposób mapowania wartości. Tabela przekształceń ma dwie kolumny:

  • Od: ciąg tekstowy do wyszukania w tabeli.
  • Do: ciąg tekstowy do użycia w celu zastąpienia ciągu tekstowego w kolumnie Od .

Na poniższej ilustracji przedstawiono tabelę przekształcania użytą w tym przykładzie.

Tabela przedstawiająca wartości Od mike'a i Williama oraz Wartości Miguela i Billa.

Ważne

Ważne jest, aby tabela transformacji miała takie same kolumny i nazwy kolumn, jak pokazano powyżej (muszą być "Od" i "Do"), w przeciwnym razie dodatek Power Query nie rozpozna tych nazw.

Wróć do okna dialogowego Grupuj według, rozwiń opcje grupy Rozmyte, zmień operację z Liczba wierszy na Wszystkie wiersze, włącz opcję Pokaż wyniki podobieństwa, a następnie wybierz menu rozwijane Tabela przekształceń.

Menu rozwijane przykładowej tabeli przekształcania rozmyte grupowania.

Po wybraniu tabeli przekształceń wybierz przycisk OK. Wynikiem tej operacji są następujące informacje:

Przykładowa tabela końcowa grupowania rozmytego z tabelą przekształcania.

W tym przykładzie włączono opcję Ignoruj wielkość liter, więc wartości w kolumnie Od tabeli Przekształcenia są używane do wyszukiwania ciągu tekstowego bez uwzględniania wielkości liter ciągu. Ta operacja przekształcania następuje najpierw, a następnie wykonywana jest operacja grupowania rozmytego.

Wynik podobieństwa jest również wyświetlany w wartości tabeli obok kolumny osoby, która odzwierciedla dokładnie sposób grupowania wartości i ich odpowiednich wyników podobieństwa. Możesz rozwinąć tę kolumnę w razie potrzeby lub użyć wartości z nowych kolumn Frequency dla innych rodzajów przekształceń.

Uwaga

Podczas grupowania według wielu kolumn tabela przekształceń wykonuje operację zamieniania we wszystkich kolumnach, jeśli zamiana wartości zwiększa wynik podobieństwa.

Zobacz też

Dodawanie kolumny niestandardowej
Usuwanie duplikatów