Udostępnij za pomocą


Korzystanie z narzędzi profilowania danych

Narzędzia profilowania danych zapewniają nowe i intuicyjne sposoby czyszczenia, przekształcania i interpretowania danych w Edytor Power Query. To na przykład:

  • Jakość kolumn

  • Rozkład kolumn

  • Profil kolumny

Aby włączyć narzędzia profilowania danych, przejdź do karty Widok na wstążce. W programie Power Query Desktop włącz żądane opcje w grupie Podgląd danych, jak pokazano na poniższej ilustracji.

Screenshot of the Data profiling tools selected under the Power Query View tab.Zrzut ekranu przedstawiający narzędzia profilowania danych wybrane na karcie Widok dodatku Power Query.

W usłudze Power Query Online wybierz pozycję Widok danych, a następnie włącz żądane opcje z listy rozwijanej.

Screenshot of the data profiling tools selected under Data view in the View tab.Zrzut ekranu przedstawiający narzędzia profilowania danych wybrane w obszarze Widok danych na karcie Widok.

Po włączeniu opcji informacje o profilowaniu danych są wyświetlane w edytorze Power Query.

Screenshot of the data profiling tools after they're set up.Zrzut ekranu przedstawiający narzędzia profilowania danych po ich skonfigurowaniu.

Uwaga

Domyślnie dodatek Power Query wykonuje profilowanie danych w pierwszych 1000 wierszach danych. Aby obsługiwać cały zestaw danych, wybierz profilowanie kolumn na podstawie 1000 pierwszych wierszy w lewym dolnym rogu okna edytora, aby zmienić profilowanie kolumn na Profilowanie kolumn na podstawie całego zestawu danych.

Jakość kolumn

Wartości etykiet cech jakości kolumny w wierszach w pięciu kategoriach:

  • Prawidłowe, wyświetlane na zielono.

  • Błąd, pokazany na czerwono.

  • Puste, wyświetlane w ciemnoszarym.

  • Nieznany, pokazany w kolorze kreskowym zielonym. Wskazuje, że w kolumnie występują błędy, jakość pozostałych danych jest nieznana.

  • Nieoczekiwany błąd wyświetlany w kolorze kreskowym czerwonym.

Te wskaźniki są wyświetlane bezpośrednio pod nazwą kolumny w ramach małego wykresu słupkowego.

Screenshot of the enhanced view of the bar chart with data quality indicators and labels above each column in the table.Zrzut ekranu przedstawiający rozszerzony widok wykresu słupkowego ze wskaźnikami jakości danych i etykietami powyżej każdej kolumny w tabeli.

Liczba rekordów w każdej kategorii jakości kolumny jest również wyświetlana jako wartość procentowa.

Po umieszczeniu wskaźnika myszy na dowolnej kolumnie zostanie wyświetlony rozkład liczbowy jakości wartości w całej kolumnie. Ponadto wybranie przycisku wielokropka (...) powoduje otwarcie niektórych przycisków szybkiej akcji dla operacji na wartościach.

Screenshot of the distribution of names column with 701 names valid (100 percent), zero errors and zero empty, with quick action commands displayed.Zrzut ekranu przedstawiający rozkład kolumny nazw z 701 prawidłowymi nazwami (100 procent), zerowymi błędami i zerowymi pustymi, z wyświetlonymi poleceniami szybkiej akcji.

Rozkład kolumn

Ta funkcja udostępnia zestaw wizualizacji pod nazwami kolumn, które prezentują częstotliwość i rozkład wartości w każdej kolumnie. Dane w tych wizualizacjach są sortowane w kolejności malejącej od wartości o najwyższej częstotliwości.

Screenshot of the data profiling tools with the upper column distribution emphasized.Zrzut ekranu przedstawiający narzędzia profilowania danych z podkreślonym rozkładem górnej kolumny.

Po umieszczeniu wskaźnika myszy na danych dystrybucji w dowolnej kolumnie uzyskasz informacje o ogólnych danych w kolumnie (z unikatową liczbą i unikatowymi wartościami). Funkcja Distinct odnosi się do ogólnej liczby różnych wartości w każdej kolumnie. Unikatowe odnosi się do wartości, które mają tylko jedno wystąpienie w kolumnie. Możesz również wybrać przycisk wielokropka i wybrać z menu dostępnych operacji.

Screenshot of the data profiling tools with the column distributions options emphasized.Zrzut ekranu przedstawiający narzędzia profilowania danych z podkreśleniami opcji dystrybucji kolumn.

Profil kolumny

Ta funkcja zapewnia bardziej szczegółowe spojrzenie na dane w kolumnie. Oprócz wykresu rozkładu kolumn zawiera on wykres statystyk kolumnowych. Te informacje są wyświetlane poniżej sekcji podglądu danych.

Screenshot of the data profiling tool with the column profile emphasized.Zrzut ekranu przedstawiający narzędzie profilowania danych z podkreślonym profilem kolumny.

Filtruj według wartości

Możesz wchodzić w interakcje z wykresem rozkładu wartości po prawej stronie i wybierać dowolny słupek, umieszczając kursor na części wykresu.

Screenshot demonstrating how to hover over the bar in value distribution bar chart, which shows individual data for that bar.Zrzut ekranu przedstawiający sposób najechania kursorem na słupek na wykresie słupkowym dystrybucji wartości, który pokazuje poszczególne dane dla tego słupka.

Kliknij prawym przyciskiem myszy, aby wyświetlić zestaw dostępnych przekształceń dla tej wartości.

Screenshot demonstrating how to display the shortcut menu with available transformations for a single bar in the value distribution bar chart.Zrzut ekranu przedstawiający sposób wyświetlania menu skrótów z dostępnymi przekształceniami dla pojedynczego paska na wykresie słupkowym dystrybucji wartości.

Kopiowanie danych

W prawym górnym rogu sekcji statystyk kolumn i dystrybucji wartości można wybrać przycisk wielokropka (...), aby wyświetlić menu skrótów Kopiuj . Wybierz je, aby skopiować dane wyświetlane w każdej sekcji do schowka.

Screenshot of the copy shortcut menu in the column statistics column.Zrzut ekranu przedstawiający menu skrótów kopiowania w kolumnie statystyki kolumny.

Grupuj według wartości

Po wybraniu przycisku wielokropka (...) w prawym górnym rogu wykresu dystrybucji wartości oprócz opcji Kopiuj możesz wybrać pozycję Grupuj według. Ta funkcja grupuje wartości na wykresie według zestawu dostępnych opcji.

Screenshot of the copy and group by shortcut menu in the value distribution column.Zrzut ekranu przedstawiający menu kopiowania i grupowania według skrótów w kolumnie rozkładu wartości.

Na poniższej ilustracji przedstawiono kolumnę nazw produktów pogrupowanych według długości tekstu. Po zgrupowaniu wartości na wykresie można wchodzić w interakcje z poszczególnymi wartościami na wykresie zgodnie z opisem w temacie Filtruj według wartości.

Screenshot of the new bar chart showing the distribution of the text length of store names in the table's Names column.Zrzut ekranu przedstawiający nowy wykres słupkowy przedstawiający rozkład długości tekstu nazw sklepów w kolumnie Nazwy tabeli.