Korzystanie z narzędzi profilowania danych

Narzędzia profilowania danych zapewniają nowe i intuicyjne sposoby czyszczenia, przekształcania i interpretowania danych w Edytor Power Query. To na przykład:

  • Jakość kolumn

  • Rozkład kolumn

  • Profil kolumny

Aby włączyć narzędzia profilowania danych, przejdź do karty Widok na wstążce. W programie Power Query Desktop włącz żądane opcje w grupie Podgląd danych, jak pokazano na poniższej ilustracji.

Narzędzia profilowania danych.

W usłudze Power Query Online wybierz pozycję Widok danych, a następnie włącz żądane opcje z listy rozwijanej.

<tekst alternatywny>

Po włączeniu opcji w Edytor Power Query zobaczysz coś takiego jak na poniższej ilustracji.

Włączone narzędzia profilowania danych.

Uwaga

Domyślnie dodatek Power Query wykonuje profilowanie danych w pierwszych 1000 wierszach danych. Aby obsługiwać cały zestaw danych, wybierz profilowanie kolumn na podstawie 1000 pierwszych wierszy w lewym dolnym rogu okna edytora, aby zmienić profilowanie kolumn na Profilowanie kolumn na podstawie całego zestawu danych.

Jakość kolumn

Wartości etykiet cech jakości kolumny w wierszach w pięciu kategoriach:

  • Prawidłowe, wyświetlane na zielono.

  • Błąd, pokazany na czerwono.

  • Puste, wyświetlane w ciemnoszarym.

  • Nieznany, pokazany w kolorze kreskowym zielonym. Wskazuje, że w kolumnie występują błędy, jakość pozostałych danych jest nieznana.

  • Nieoczekiwany błąd wyświetlany w kolorze kreskowym czerwonym.

Te wskaźniki są wyświetlane bezpośrednio pod nazwą kolumny w ramach małego wykresu słupkowego, jak pokazano na poniższej ilustracji.

Rozszerzony widok wykresu słupkowego ze wskaźnikami jakości danych i etykietami powyżej każdej kolumny w tabeli.

Liczba rekordów w każdej kategorii jakości kolumny jest również wyświetlana jako wartość procentowa.

Po umieszczeniu wskaźnika myszy na dowolnej kolumnie zostanie wyświetlony liczbowy rozkład jakości wartości w całej kolumnie. Ponadto wybranie przycisku wielokropka (...) powoduje otwarcie niektórych przycisków szybkiej akcji dla operacji na wartościach.

Rozkład kolumn nazw z 701 nazwami prawidłowymi (100 procent), zerowymi błędami i zerowymi pustymi, z wyświetlonymi poleceniami szybkiej akcji.

Rozkład kolumn

Ta funkcja udostępnia zestaw wizualizacji pod nazwami kolumn, które prezentują częstotliwość i rozkład wartości w każdej kolumnie. Dane w tych wizualizacjach są sortowane w kolejności malejącej od wartości o najwyższej częstotliwości.

Rozkład kolumn.

Po umieszczeniu wskaźnika myszy na danych dystrybucji w dowolnej kolumnie uzyskasz informacje o ogólnych danych w kolumnie (z unikatową liczbą i unikatowymi wartościami). Możesz również wybrać przycisk wielokropka i wybrać z menu dostępnych operacji.

Opcje dystrybucji kolumn.

Profil kolumny

Ta funkcja zapewnia bardziej szczegółowe spojrzenie na dane w kolumnie. Oprócz wykresu rozkładu kolumn zawiera on wykres statystyk kolumnowych. Te informacje są wyświetlane poniżej sekcji podglądu danych, jak pokazano na poniższej ilustracji.

Profil kolumny.

Filtruj według wartości

Możesz wchodzić w interakcje z wykresem rozkładu wartości po prawej stronie i wybierać dowolny słupek, umieszczając kursor na części wykresu.

Umieść kursor na pasku na wykresie słupkowym dystrybucji wartości, który pokazuje poszczególne dane dla tego słupka.

Kliknij prawym przyciskiem myszy, aby wyświetlić zestaw dostępnych przekształceń dla tej wartości.

Wyświetla menu skrótów z dostępnymi transformatami dla pojedynczego paska na wykresie słupkowym dystrybucji wartości.

Kopiowanie danych

W prawym górnym rogu sekcji statystyk kolumn i dystrybucji wartości można wybrać przycisk wielokropka (...), aby wyświetlić menu skrótów Kopiuj . Wybierz je, aby skopiować dane wyświetlane w każdej sekcji do schowka.

Kopiuj statystyki kolumn.

Grupuj według wartości

Po wybraniu przycisku wielokropka (...) w prawym górnym rogu wykresu dystrybucji wartości oprócz opcji Kopiuj możesz wybrać pozycję Grupuj według. Ta funkcja grupuje wartości na wykresie według zestawu dostępnych opcji.

Grupuj według rozkładu wartości.

Na poniższej ilustracji przedstawiono kolumnę nazw produktów, które zostały pogrupowane według długości tekstu. Po zgrupowaniu wartości na wykresie można wchodzić w interakcje z poszczególnymi wartościami na wykresie zgodnie z opisem w temacie Filtruj według wartości.

Nowy wykres słupkowy przedstawiający rozkład długości tekstu nazw sklepów w kolumnie Nazwy tabeli.