Udostępnij za pośrednictwem


Praca z zduplikowanymi wartościami

Możesz pracować z zduplikowanymi zestawami wartości za pomocą przekształceń, które mogą usuwać duplikaty z danych. Możesz też filtrować dane, aby wyświetlać tylko duplikaty, aby skoncentrować się na nich.

Ostrzeżenie

W dodatku Power Query jest uwzględniana wielkość liter. Podczas pracy z zduplikowanymi wartościami dodatek Power Query uwzględnia przypadek tekstu, co może prowadzić do niepożądanych wyników. Aby obejść ten problem, użytkownicy mogą stosować wielkie lub małe litery przed usunięciem duplikatów.

W tym artykule przykłady korzystają z poniższej tabeli z kolumnami ID, Category i Total .

Zrzut ekranu przedstawiający początkową przykładową tabelę zawierającą kolumny ID, Category i Total.

Usuwanie duplikatów

Jedną z operacji, które można wykonać, jest usunięcie z tabeli zduplikowanych wartości.

  1. Wybierz kolumny zawierające zduplikowane wartości.

  2. Przejdź do karty Narzędzia główne .

  3. W grupie Zmniejsz wiersze wybierz pozycję Usuń wiersze.

  4. Z menu rozwijanego wybierz pozycję Usuń duplikaty.

    Zrzut ekranu przedstawiający lokalizację opcji Usuń duplikaty w obszarze Usuń wiersze.

Ostrzeżenie

Nie ma gwarancji, że pierwsze wystąpienie w zestawie duplikatów zostanie wybrane po usunięciu duplikatów. Aby dowiedzieć się więcej o sposobie zachowania sortowania, przejdź do tematu Zachowaj sortowanie.

Usuwanie duplikatów z wielu kolumn

W tym przykładzie chcesz zidentyfikować i usunąć duplikaty przy użyciu wszystkich kolumn z tabeli.

Zrzut ekranu przedstawiający początkową tabelę ze zduplikowanymi w wielu kolumnach.

Masz cztery wiersze, które są duplikatami. Twoim celem jest usunięcie tych zduplikowanych wierszy, więc w tabeli znajdują się tylko unikatowe wiersze. Wybierz wszystkie kolumny z tabeli, a następnie wybierz pozycję Usuń duplikaty.

Wynik tej operacji daje tabelę, której szukasz.

Zrzut ekranu przedstawiający końcową tabelę z duplikatami usuniętymi ze wszystkich kolumn.

Uwaga

Tę operację można również wykonać z podzbiorem kolumn.

Usuwanie duplikatów z jednej kolumny

W tym przykładzie chcesz zidentyfikować i usunąć duplikaty przy użyciu tylko kolumny Category z tabeli.

Zrzut ekranu przedstawiający początkową tabelę identyfikującą duplikaty w kolumnie Kategoria.

Chcesz usunąć te duplikaty i zachować tylko unikatowe wartości. Aby usunąć duplikaty z kolumny Kategoria , wybierz ją, a następnie wybierz pozycję Usuń duplikaty.

Wynik tej operacji daje tabelę, której szukasz.

Zrzut ekranu przedstawiający końcową tabelę z duplikatami usuniętymi z kolumny Kategoria.

Zachowaj duplikaty

Inną operacją, którą można wykonać z duplikatami, jest zachowanie tylko duplikatów znalezionych w tabeli.

  1. Wybierz kolumny zawierające zduplikowane wartości.

  2. Przejdź do karty Narzędzia główne .

  3. W grupie Zmniejsz wiersze wybierz pozycję Zachowaj wiersze.

  4. Z menu rozwijanego wybierz pozycję Zachowaj duplikaty.

    Zrzut ekranu przedstawiający lokalizację opcji Zachowaj duplikaty w obszarze Zachowaj wiersze.

Zachowaj duplikaty z wielu kolumn

W tym przykładzie chcesz zidentyfikować i zachować duplikaty przy użyciu wszystkich kolumn z tabeli.

Zrzut ekranu przedstawiający początkową tabelę do przechowywania duplikatów z wielu kolumn.

Masz cztery wiersze, które są duplikatami. Celem w tym przykładzie jest zachowanie tylko wierszy, które są zduplikowane w tabeli. Zaznacz wszystkie kolumny w tabeli, a następnie wybierz pozycję Zachowaj duplikaty.

Wynik tej operacji daje tabelę, której szukasz.

Zrzut ekranu przedstawiający końcową tabelę z tylko zduplikowanymi wierszami z wielu kolumn.

Zachowaj duplikaty z jednej kolumny

W tym przykładzie chcesz zidentyfikować i zachować duplikaty przy użyciu tylko kolumny id z tabeli.

Początkowa tabela do przechowywania duplikatów z jednej kolumny.

W tym przykładzie masz wiele duplikatów i chcesz zachować tylko te duplikaty z tabeli. Aby zachować duplikaty z kolumny id , wybierz kolumnę id , a następnie wybierz pozycję Zachowaj duplikaty.

Wynik tej operacji daje tabelę, której szukasz.

Końcowa tabela z tylko zduplikowanymi wierszami z jednej kolumny.

Narzędzia profilowania danych