Udostępnij za pośrednictwem


Grupowanie lub podsumowywanie wierszy

W dodatku Power Query można grupować wartości w różnych wierszach w jedną wartość, grupując wiersze według wartości w co najmniej jednej kolumnie. Można wybrać spośród dwóch typów operacji grupowania:

  • Grupowania kolumn.

  • Grupowania wierszy.

Na potrzeby tego samouczka używasz poniższej przykładowej tabeli.

Przykładowa tabela początkowa.

Zrzut ekranu przedstawiający tabelę z kolumnami Year (2020), Country (USA, Panama lub Canada), Product (Shirt lub Shorts), Sales channel (Online lub Reseller) i Units (różne wartości z zakresu od 55 do 7500)

Gdzie znaleźć przycisk Grupuj według

Przycisk Grupuj według można znaleźć w trzech miejscach:

  • Na karcie Narzędzia główne w grupie Przekształć.

    Zrzut ekranu przedstawiający wstążkę Dodatku Power Query z opcją Grupuj według na karcie Narzędzia główne.

  • Na karcie Przekształć w grupie Tabela.

    Zrzut ekranu przedstawiający wstążkę Dodatku Power Query z opcją Grupuj według na karcie Przekształć.

  • W menu skrótów po kliknięciu prawym przyciskiem myszy, aby wybrać kolumny.

    Zrzut ekranu przedstawiający tabelę z opcją Grupuj według podkreślonej w menu skrótów.

Używanie funkcji agregującej do grupowania według co najmniej jednej kolumny

W tym przykładzie twoim celem jest podsumowanie łącznej liczby sprzedanych jednostek na poziomie kraju i kanału sprzedaży. Kolumny Country (Kraj) i Sales Channel (Kanał sprzedaży) służą do wykonywania operacji grupowania według.

  1. Wybierz pozycję Grupuj według na karcie Narzędzia główne .
  2. Wybierz opcję Zaawansowane, aby wybrać wiele kolumn do grupowania.
  3. Wybierz kolumnę Country (Kraj ).
  4. Wybierz pozycję Dodaj grupowanie.
  5. Wybierz kolumnę Sales Channel (Kanał sprzedaży).
  6. W polu Nazwa nowej kolumny wprowadź wartość Total units (Całkowita liczba jednostek) w obszarze Operation (Operacja), wybierz pozycję Sum (Suma) i w polu Column (Kolumna) wybierz pozycję Units (Jednostki).
  7. Wybierz OK

Zrzut ekranu przedstawiający okno dialogowe Grupuj według z wypełnionymi zagregowanymi kolumnami.

Ta operacja zawiera poniższą tabelę.

Zrzut ekranu przedstawiający przykładową tabelę danych wyjściowych z kolumnami Country (Kraj), Sales Channel (Kanał sprzedaży) i Total units (Łączna liczba jednostek).

Dostępne operacje

Dzięki funkcji Grupuj według dostępne operacje można podzielić na dwa sposoby:

  • Operacja na poziomie wiersza
  • Operacja na poziomie kolumny

W poniższej tabeli opisano każdą z tych operacji.

Nazwa operacji Kategoria opis
Sum Operacja kolumny Sumuje wszystkie wartości z kolumny
Średnia Operacja kolumny Oblicza średnią wartość z kolumny
Mediana Operacja kolumny Oblicza medianę z kolumny
Min Operacja kolumny Oblicza minimalną wartość z kolumny
Maksimum Operacja kolumny Oblicza maksymalną wartość z kolumny
Percentyl Operacja kolumny Oblicza percentyl przy użyciu wartości wejściowej od 0 do 100 z kolumny
Zlicz unikatowe wartości Operacja kolumny Oblicza liczbę unikatowych wartości z kolumny
Zlicz wiersze Operacja wiersza Oblicza całkowitą liczbę wierszy z danej grupy
Zlicz unikatowe wiersze Operacja wiersza Oblicza liczbę odrębnych wierszy z danej grupy
Wszystkie wiersze Operacja wiersza Zwraca wszystkie zgrupowane wiersze w wartości tabeli bez agregacji

Uwaga

Liczba unikatowych wartości i operacji percentylu są dostępne tylko w usłudze Power Query Online.

Wykonywanie operacji grupowania według co najmniej jednej kolumny

Począwszy od oryginalnego przykładu, w tym przykładzie utworzysz kolumnę zawierającą łączną liczbę jednostek i dwie inne kolumny, które dają nazwę i jednostki sprzedawane dla produktu o najwyższej wydajności, podsumowane na poziomie kraju i kanału sprzedaży.

Zrzut ekranu przedstawiający przykładową tabelę danych wyjściowych z operacjami.

  1. Użyj następujących kolumn jako Grupuj według kolumn:

    • Kraj
    • Kanał sprzedaży
  2. Utwórz dwie nowe kolumny, wykonując następujące kroki:

    1. Agregowanie kolumny Units (Jednostki) przy użyciu operacji Sum (Suma). Nadaj tej kolumnie nazwę Total units (Całkowita liczba jednostek).
    2. Dodaj nową kolumnę Products przy użyciu operacji Wszystkie wiersze .

    Zrzut ekranu przedstawiający okno dialogowe Grupuj według z kolumną nieaggregateną.

Po zakończeniu tej operacji zwróć uwagę, że kolumna Products zawiera wartości [Table] wewnątrz każdej komórki. Każda wartość [Tabela] zawiera wszystkie wiersze pogrupowane według kolumn Country (Kraj ) i Sales Channel (Kanał sprzedaży) z oryginalnej tabeli. W komórce możesz wybrać biały znak, aby wyświetlić podgląd zawartości tabeli w dolnej części okna dialogowego.

Zrzut ekranu przedstawiający okienko podglądu szczegółów tabeli.

Uwaga

Okienko podglądu szczegółów może nie zawierać wszystkich wierszy używanych do operacji grupowania. Możesz wybrać wartość [Tabela], aby wyświetlić wszystkie wiersze odnoszące się do odpowiedniej operacji grupowania.

Następnie należy wyodrębnić wiersz o najwyższej wartości w kolumnie Units (Jednostki) tabel w nowej kolumnie Products (Produkty) i wywołać tę nową kolumnę Produkt o najwyższej wydajności.

Wyodrębnianie informacji o produkcie o najwyższej wykonawców

Nowa kolumna Products (Produkty) z wartościami [Table] umożliwia utworzenie nowej kolumny niestandardowej, przechodząc do karty Dodaj kolumnę na wstążce i wybierając pozycję Kolumna niestandardowa z grupy Ogólne.

Zrzut ekranu przedstawiający wstążkę Dodatku Power Query z opcją Kolumna niestandardowa podkreślona na karcie Dodaj kolumnę.

Nadaj nowej kolumnie nazwę top performer product. Wprowadź formułę Table.Max([Products], "Units" ) w obszarze Formuła kolumny niestandardowej.

Zrzut ekranu przedstawiający okno dialogowe Kolumna niestandardowa z wprowadzoną formułą Table.Max.

Wynik tej formuły tworzy nową kolumnę z wartościami [Record]. Te wartości rekordów są zasadniczo tabelą z tylko jednym wierszem. Te rekordy zawierają wiersz z maksymalną wartością kolumny Units (Jednostki) każdej wartości [Table] w kolumnie Products (Produkty).

Zrzut ekranu przedstawiający wynik formuły kolumny niestandardowej z tabelą Table.Max.

Po wykonaniu tej nowej kolumny produktu o najwyższej wydajności zawierającej wartości [Rekord] możesz wybrać ikonę rozwijania, wybrać pola Product and Units (Produkty i jednostki), a następnie wybrać przycisk OK.

Zrzut ekranu przedstawiający operację rozwijania wartości rekordu w kolumnie Produkt najlepiej wykonujący.

Po usunięciu kolumny Products i ustawieniu typu danych dla obu nowo rozwiniętych kolumn wynik będzie podobny do poniższego obrazu.

Zrzut ekranu przedstawiający końcową tabelę ze wszystkimi przekształceniami.

Grupowanie rozmyte

Uwaga

Poniższa funkcja jest dostępna tylko w usłudze Power Query Online.

Aby zademonstrować sposób "grupowania rozmytego", rozważ przykładową tabelę pokazaną na poniższej ilustracji.

Zrzut ekranu przedstawiający tabelę z dziewięcioma wierszami wpisów, które zawierają różne pisownie i litery nazwy Miguel i William.

Celem grupowania rozmytego jest wykonywanie operacji grupowania według, która używa przybliżonego algorytmu dopasowania dla ciągów tekstowych. Dodatek Power Query używa algorytmu podobieństwa Jaccard do mierzenia podobieństwa między parami wystąpień. Następnie stosuje klastry hierarchiczne agglomeracyjne do grupowania wystąpień razem. Na poniższej ilustracji przedstawiono oczekiwane dane wyjściowe, w których tabela jest pogrupowana według kolumny Person .

Zrzut ekranu przedstawiający tabelę przedstawiającą pozycje Person jako Miguel i Mike oraz Frequency odpowiednio jako 3 i 2.

Aby wykonać grupowanie rozmyte, wykonaj te same kroki opisane wcześniej w tym artykule. Jedyną różnicą jest to, że tym razem w oknie dialogowym Grupuj według zaznacz pole wyboru Użyj grupowania rozmytego.

Zrzut ekranu przedstawiający pole wyboru Grupowanie rozmyte podkreślone w oknie dialogowym Grupuj według.

Dla każdej grupy wierszy dodatek Power Query wybiera najczęściej używane wystąpienie jako wystąpienie "kanoniczne". Jeśli wystąpi wiele wystąpień z tą samą częstotliwością, dodatek Power Query wybierze pierwszy z nich. Po wybraniu przycisku OK w oknie dialogowym Grupuj według otrzymasz oczekiwany wynik.

Zrzut ekranu przedstawiający przykładową tabelę finalną grupowania rozmytego bez tabeli przekształcenia.

Jednak masz większą kontrolę nad operacją grupowania rozmytego, rozwijając opcje grupy Rozmyte.

Zrzut ekranu przedstawiający okno dialogowe Grupuj według z zaznaczonymi opcjami grupy Rozmyte.

Dostępne są następujące opcje grupowania rozmyte:

  • Próg podobieństwa (opcjonalnie): Ta opcja wskazuje, jak podobne dwie wartości muszą być zgrupowane razem. Ustawienie minimalnej wartości zero (0) powoduje zgrupowanie wszystkich wartości. Ustawienie maksymalne 1 umożliwia grupowanie wartości, które dokładnie pasują do siebie. Wartość domyślna to 0,8.
  • Ignoruj wielkość liter: w przypadku porównywania ciągów tekstowych wielkość liter jest ignorowana. Ta opcja jest domyślnie włączona.
  • Grupuj, łącząc części tekstowe: algorytm próbuje połączyć części tekstowe (takie jak łączenie mikro i miękkie w firmie Microsoft) z wartościami grupowymi.
  • Pokaż wyniki podobieństwa: Pokaż wyniki podobieństwa między wartościami wejściowymi a obliczonymi wartościami reprezentatywnymi po grupowaniu rozmyte. Wymaga dodania operacji, takiej jak Wszystkie wiersze , aby zaprezentować te informacje na poziomie wiersza po wierszu.
  • Tabela przekształceń (opcjonalnie): możesz wybrać tabelę przekształcania, która mapuje wartości (takie jak mapowanie msFT na firmę Microsoft) w celu grupowania ich razem.

W tym przykładzie tabela przekształceń służy do zademonstrowania sposobu mapowania wartości. Tabela przekształceń ma dwie kolumny:

  • Od: ciąg tekstowy do wyszukania w tabeli.
  • Do: ciąg tekstowy do użycia w celu zastąpienia ciągu tekstowego w kolumnie Od .

Na poniższej ilustracji przedstawiono tabelę przekształcania użytą w tym przykładzie.

Zrzut ekranu przedstawiający tabelę z wartościami mike'a i Williama oraz Wartości Miguela i Billa.

Ważne

Ważne jest, aby tabela przekształceń miała takie same kolumny i nazwy kolumn, jak pokazano na poprzedniej ilustracji (muszą być oznaczone etykietą "Od" i "Do"). W przeciwnym razie dodatek Power Query nie rozpoznaje tabeli jako tabeli przekształceń.

Wróć do okna dialogowego Grupuj według, rozwiń opcje grupy Rozmyte, zmień operację z Liczba wierszy na Wszystkie wiersze, włącz opcję Pokaż wyniki podobieństwa, a następnie wybierz menu rozwijane Tabela przekształceń.

Zrzut ekranu przedstawiający menu rozwijane przykładowej tabeli przekształceń grupowania rozmytego.

Po wybraniu tabeli przekształceń wybierz przycisk OK. Wynikiem tej operacji są następujące informacje:

Zrzut ekranu przedstawiający przykładową tabelę końcową grupowania rozmytą z tabelą przekształcania.

W tym przykładzie włączono opcję Ignoruj wielkość liter, więc wartości w kolumnie Od tabeli Przekształcenia są używane do wyszukiwania ciągu tekstowego bez uwzględniania wielkości liter ciągu. Ta operacja przekształcania następuje najpierw, a następnie wykonywana jest operacja grupowania rozmytego.

Wynik podobieństwa jest również wyświetlany w wartości tabeli obok kolumny osoby, która odzwierciedla dokładnie sposób grupowania wartości i ich odpowiednich wyników podobieństwa. Możesz rozwinąć tę kolumnę w razie potrzeby lub użyć wartości z nowych kolumn Frequency dla innych rodzajów przekształceń.

Uwaga

Podczas grupowania według wielu kolumn tabela przekształceń wykonuje operację zamieniania we wszystkich kolumnach, jeśli zamiana wartości zwiększa wynik podobieństwa.

Aby uzyskać więcej informacji na temat sposobu działania tabel przekształceń, przejdź do sekcji Wymagania dotyczące tabeli przekształcania.

Zobacz też

Dodawanie kolumny niestandardowej
Usuwanie duplikatów