Grupowanie lub podsumowywanie wierszy
W dodatku Power Query można grupować wartości w różnych wierszach w jedną wartość, grupując wiersze według wartości w co najmniej jednej kolumnie. Można wybrać spośród dwóch typów operacji grupowania:
Grupowania kolumn.
Grupowania wierszy.
W tym samouczku użyjesz poniższej przykładowej tabeli.
Tabela z kolumnami z kolumnami Year (2020), Country (USA, Panama lub Canada), Product (Shirt lub Shorts), Sales channel (Online lub Reseller) i Units (różne wartości z zakresu od 55 do 7500)
Gdzie znaleźć przycisk Grupuj według
Przycisk Grupuj według można znaleźć w trzech miejscach:
Na karcie Narzędzia główne w grupie Przekształć.
Na karcie Przekształć w grupie Tabela.
W menu skrótów po kliknięciu prawym przyciskiem myszy, aby wybrać kolumny.
Używanie funkcji agregującej do grupowania według co najmniej jednej kolumny
W tym przykładzie twoim celem jest podsumowanie łącznej liczby sprzedanych jednostek na poziomie kraju i kanału sprzedaży. Użyjesz kolumn Country (Kraj ) i Sales Channel (Kanał sprzedaży), aby wykonać grupę według operacji.
- Wybierz pozycję Grupuj według na karcie Narzędzia główne .
- Wybierz opcję Zaawansowane, aby wybrać wiele kolumn do grupowania.
- Wybierz kolumnę Country (Kraj ).
- Wybierz pozycję Dodaj grupowanie.
- Wybierz kolumnę Sales Channel (Kanał sprzedaży).
- W polu Nazwa nowej kolumny wprowadź wartość Total units (Całkowita liczba jednostek) w obszarze Operation (Operacja), wybierz pozycję Sum (Suma) i w polu Column (Kolumna) wybierz pozycję Units (Jednostki).
- Wybierz OK
Ta operacja zawiera poniższą tabelę.
Dostępne operacje
Dzięki funkcji Grupuj według dostępne operacje można podzielić na dwa sposoby:
- Operacja na poziomie wiersza
- Operacja na poziomie kolumny
W poniższej tabeli opisano każdą z tych operacji.
Nazwa operacji | Kategoria | opis |
---|---|---|
Sum | Operacja kolumny | Sumuje wszystkie wartości z kolumny |
Średnia | Operacja kolumny | Oblicza średnią wartość z kolumny |
Mediana | Operacja kolumny | Oblicza medianę z kolumny |
Min | Operacja kolumny | Oblicza minimalną wartość z kolumny |
Maksimum | Operacja kolumny | Oblicza maksymalną wartość z kolumny |
Percentyl | Operacja kolumny | Oblicza percentyl przy użyciu wartości wejściowej od 0 do 100 z kolumny |
Zlicz unikatowe wartości | Operacja kolumny | Oblicza liczbę unikatowych wartości z kolumny |
Zlicz wiersze | Operacja wiersza | Oblicza całkowitą liczbę wierszy z danej grupy |
Zlicz unikatowe wiersze | Operacja wiersza | Oblicza liczbę odrębnych wierszy z danej grupy |
Wszystkie wiersze | Operacja wiersza | Zwraca wszystkie zgrupowane wiersze w wartości tabeli bez agregacji |
Uwaga
Liczba unikatowych wartości i operacji percentylu są dostępne tylko w usłudze Power Query Online.
Wykonywanie operacji grupowania według co najmniej jednej kolumny
Począwszy od oryginalnego przykładu, w tym przykładzie utworzysz kolumnę zawierającą łączną liczbę jednostek i dwie inne kolumny, które dają nazwę i jednostki sprzedawane dla produktu o najwyższej wydajności, podsumowane na poziomie kraju i kanału sprzedaży.
Użyj następujących kolumn jako Grupuj według kolumn:
- Kraj
- Kanał sprzedaży
Utwórz dwie nowe kolumny, wykonując następujące kroki:
- Agregowanie kolumny Units (Jednostki) przy użyciu operacji Sum (Suma). Nadaj tej kolumnie nazwę Total units (Całkowita liczba jednostek).
- Dodaj nową kolumnę Products przy użyciu operacji Wszystkie wiersze .
Po zakończeniu tej operacji zwróć uwagę, że kolumna Products zawiera wartości [Table] wewnątrz każdej komórki. Każda wartość [Tabela] zawiera wszystkie wiersze pogrupowane według kolumn Country (Kraj ) i Sales Channel (Kanał sprzedaży) z oryginalnej tabeli. W komórce możesz wybrać biały znak, aby wyświetlić podgląd zawartości tabeli w dolnej części okna dialogowego.
Uwaga
Okienko podglądu szczegółów może nie zawierać wszystkich wierszy używanych do operacji grupowania. Możesz wybrać wartość [Tabela], aby wyświetlić wszystkie wiersze odnoszące się do odpowiedniej operacji grupowania.
Następnie należy wyodrębnić wiersz o najwyższej wartości w kolumnie Units (Jednostki) tabel w nowej kolumnie Products (Produkty) i wywołać tę nową kolumnę Produkt o najwyższej wydajności.
Wyodrębnianie informacji o produkcie o najwyższej wykonawców
Nowa kolumna Products (Produkty) z wartościami [Table] umożliwia utworzenie nowej kolumny niestandardowej, przechodząc do karty Dodaj kolumnę na wstążce i wybierając pozycję Kolumna niestandardowa z grupy Ogólne.
Nadaj nowej kolumnie nazwę top performer product. Wprowadź formułę Table.Max([Products], "Units" )
w obszarze Formuła kolumny niestandardowej.
Wynik tej formuły tworzy nową kolumnę z wartościami [Record]. Te wartości rekordów są zasadniczo tabelą z tylko jednym wierszem. Te rekordy zawierają wiersz z maksymalną wartością kolumny Units (Jednostki) każdej wartości [Table] w kolumnie Products (Produkty).
Po wykonaniu tej nowej kolumny produktu o najwyższej wydajności zawierającej wartości [Rekord] możesz wybrać ikonę rozwijania, wybrać pola Product and Units (Produkty i jednostki), a następnie wybrać przycisk OK.
Po usunięciu kolumny Products i ustawieniu typu danych dla obu nowo rozwiniętych kolumn wynik będzie podobny do poniższego obrazu.
Grupowanie rozmyte
Uwaga
Poniższa funkcja jest dostępna tylko w usłudze Power Query Online.
Aby zademonstrować sposób "grupowania rozmytego", rozważ przykładową tabelę pokazaną na poniższej ilustracji.
Celem grupowania rozmytego jest wykonywanie operacji grupowania według, która używa przybliżonego algorytmu dopasowania dla ciągów tekstowych. Dodatek Power Query używa algorytmu podobieństwa Jaccard do mierzenia podobieństwa między parami wystąpień. Następnie stosuje klastry hierarchiczne agglomeracyjne do grupowania wystąpień razem. Na poniższej ilustracji przedstawiono oczekiwane dane wyjściowe, w których tabela zostanie pogrupowana według kolumny Person .
Aby wykonać grupowanie rozmyte, wykonaj te same kroki opisane wcześniej w tym artykule. Jedyną różnicą jest to, że tym razem w oknie dialogowym Grupuj według zaznacz pole wyboru Użyj grupowania rozmytego.
Dla każdej grupy wierszy dodatek Power Query wybierze najczęściej używane wystąpienie jako wystąpienie "kanoniczne". Jeśli wystąpi wiele wystąpień z tą samą częstotliwością, dodatek Power Query wybierze pierwszy z nich. Po wybraniu przycisku OK w oknie dialogowym Grupuj według otrzymasz oczekiwany wynik.
Jednak masz większą kontrolę nad operacją grupowania rozmytego, rozwijając opcje grupy Rozmyte.
Dostępne są następujące opcje grupowania rozmyte:
- Próg podobieństwa (opcjonalnie): Ta opcja wskazuje, jak podobne dwie wartości muszą być zgrupowane razem. Ustawienie minimalnej wartości 0 spowoduje zgrupowanie wszystkich wartości. Ustawienie maksymalne 1 będzie zezwalać tylko na grupowanie wartości, które dokładnie pasują do siebie. Wartość domyślna to 0,8.
- Ignoruj wielkość liter: podczas porównywania ciągów tekstowych wielkość liter zostanie zignorowana. Ta opcja jest domyślnie włączona.
- Grupuj, łącząc części tekstowe: algorytm spróbuje połączyć części tekstowe (takie jak łączenie mikro i miękkie w firmie Microsoft) w celu grupowania wartości.
- Pokaż wyniki podobieństwa: Pokaż wyniki podobieństwa między wartościami wejściowymi a obliczonymi wartościami reprezentatywnymi po grupowaniu rozmyte. Wymaga dodania operacji, takiej jak Wszystkie wiersze , aby zaprezentować te informacje na poziomie wiersza po wierszu.
- Tabela przekształceń (opcjonalnie): możesz wybrać tabelę przekształceń, która będzie mapować wartości (takie jak mapowanie msFT na firmę Microsoft), aby grupować je razem.
W tym przykładzie zostanie użyta tabela przekształceń, aby zademonstrować sposób mapowania wartości. Tabela przekształceń ma dwie kolumny:
- Od: ciąg tekstowy do wyszukania w tabeli.
- Do: ciąg tekstowy do użycia w celu zastąpienia ciągu tekstowego w kolumnie Od .
Na poniższej ilustracji przedstawiono tabelę przekształcania użytą w tym przykładzie.
Ważne
Ważne jest, aby tabela transformacji miała takie same kolumny i nazwy kolumn, jak pokazano powyżej (muszą być "Od" i "Do"), w przeciwnym razie dodatek Power Query nie rozpozna tych nazw.
Wróć do okna dialogowego Grupuj według, rozwiń opcje grupy Rozmyte, zmień operację z Liczba wierszy na Wszystkie wiersze, włącz opcję Pokaż wyniki podobieństwa, a następnie wybierz menu rozwijane Tabela przekształceń.
Po wybraniu tabeli przekształceń wybierz przycisk OK. Wynikiem tej operacji są następujące informacje:
W tym przykładzie włączono opcję Ignoruj wielkość liter, więc wartości w kolumnie Od tabeli Przekształcenia są używane do wyszukiwania ciągu tekstowego bez uwzględniania wielkości liter ciągu. Ta operacja przekształcania następuje najpierw, a następnie wykonywana jest operacja grupowania rozmytego.
Wynik podobieństwa jest również wyświetlany w wartości tabeli obok kolumny osoby, która odzwierciedla dokładnie sposób grupowania wartości i ich odpowiednich wyników podobieństwa. Możesz rozwinąć tę kolumnę w razie potrzeby lub użyć wartości z nowych kolumn Frequency dla innych rodzajów przekształceń.
Uwaga
Podczas grupowania według wielu kolumn tabela przekształceń wykonuje operację zamieniania we wszystkich kolumnach, jeśli zamiana wartości zwiększa wynik podobieństwa.
Zobacz też
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla