Sdílet prostřednictvím


Použití nástrojů pro profilaci dat

Nástroje pro profilaci dat poskytují nové a intuitivní způsoby čištění, transformace a pochopení dat v Editor Power Query. Patří sem:

  • Kvalita sloupce

  • Distribuce sloupce

  • Profil sloupce

Pokud chcete povolit nástroje pro profilaci dat, přejděte na kartu Zobrazení na pásu karet. V Power Query Desktopu povolte požadované možnosti ve skupině Náhled dat, jak je znázorněno na následujícím obrázku.

Screenshot of the Data profiling tools selected under the Power Query View tab.Snímek obrazovky s nástroji pro profilaci dat vybranými na kartě Zobrazení Power Query

V Power Query Online vyberte Zobrazení dat a potom povolte požadované možnosti v rozevíracím seznamu.

Screenshot of the data profiling tools selected under Data view in the View tab.Snímek obrazovky s nástroji profilace dat vybranými v zobrazení Data na kartě Zobrazení

Po povolení možností se informace o profilaci dat zobrazí v editoru Power Query.

Screenshot of the data profiling tools after they're set up.Snímek obrazovky s nástroji pro profilaci dat po jejich nastavení

Poznámka:

Power Query ve výchozím nastavení provádí profilaci dat přes prvních 1 000 řádků dat. Pokud chcete, aby fungovala s celou sadou dat, vyberte profilaci sloupců na základě prvních 1000 řádků v levém dolním rohu okna editoru a změňte profilaci sloupců na profilaci sloupců na základě celé sady dat.

Kvalita sloupce

Kvalita sloupce označuje hodnoty v řádcích v pěti kategoriích:

  • Platné, zobrazené zeleně.

  • Chyba zobrazená červeně

  • Prázdné, zobrazené tmavě šedá.

  • Neznámý, zobrazený v přerušované zelené barvě. Označuje, kdy ve sloupci dojde k chybám, kvalita zbývajících dat je neznámá.

  • Neočekávaná chyba zobrazená červeně přerušovaná

Tyto indikátory se zobrazují přímo pod názvem sloupce jako součást malého pruhového grafu.

Screenshot of the enhanced view of the bar chart with data quality indicators and labels above each column in the table.Snímek obrazovky s rozšířeným zobrazením pruhového grafu s indikátory kvality dat a popisky nad každým sloupcem v tabulce

Počet záznamů v každé kategorii kvality sloupce se také zobrazuje jako procento.

Když najedete myší na některý ze sloupců, zobrazí se číselná distribuce kvality hodnot v celém sloupci. Výběrem tlačítka se třemi tečky (...) se navíc otevře několik tlačítek rychlých akcí pro operace s hodnotami.

Screenshot of the distribution of names column with 701 names valid (100 percent), zero errors and zero empty, with quick action commands displayed.Snímek obrazovky s rozdělením sloupce názvů s platnými názvy 701 (100 procent), nulovými chybami a nulovými prázdnými a zobrazenými příkazy rychlých akcí

Distribuce sloupce

Tato funkce poskytuje sadu vizuálů pod názvy sloupců, které znázorňují frekvenci a distribuci hodnot v jednotlivých sloupcích. Data v těchto vizualizacích se seřadí sestupně od hodnoty s nejvyšší frekvencí.

Screenshot of the data profiling tools with the upper column distribution emphasized.Snímek obrazovky s nástroji pro profilaci dat se zvýrazněnou distribucí horního sloupce

Když najedete myší na distribuční data v libovolném sloupci, získáte informace o celkových datech ve sloupci (s jedinečným počtem a jedinečnými hodnotami). Distinct odkazuje na celkový počet různých hodnot v každém sloupci. Jedinečné odkazuje na hodnoty, které mají ve sloupci pouze jednu instanci. Můžete také vybrat tlačítko se třemi tečky a vybrat z nabídky dostupných operací.

Screenshot of the data profiling tools with the column distributions options emphasized.Snímek obrazovky s nástroji pro profilaci dat se zvýrazněnými možnostmi distribuce sloupců

Profil sloupce

Tato funkce poskytuje podrobnější pohled na data ve sloupci. Kromě distribučního grafu sloupců obsahuje sloupcový graf statistiky. Tyto informace se zobrazí pod oddílem náhledu dat.

Screenshot of the data profiling tool with the column profile emphasized.Snímek obrazovky nástroje pro profilaci dat se zvýrazněným profilem sloupce

Filtrovat podle hodnoty

S distribučním grafem hodnot na pravé straně můžete pracovat a vybrat některý z pruhů tak, že najedete myší na části grafu.

Screenshot demonstrating how to hover over the bar in value distribution bar chart, which shows individual data for that bar.Snímek obrazovky znázorňující, jak najet myší na pruhový graf v pruhovém grafu s hodnotami, který zobrazuje jednotlivá data pro tento pruh

Kliknutím pravým tlačítkem myši zobrazíte sadu dostupných transformací pro danou hodnotu.

Screenshot demonstrating how to display the shortcut menu with available transformations for a single bar in the value distribution bar chart.Snímek obrazovky znázorňující, jak zobrazit místní nabídku s dostupnými transformacemi pro jeden pruh v grafu distribučních pruhů hodnot

Kopírování dat

V pravém horním rohu oddílů statistiky sloupce i distribuce hodnot můžete vybrat tlačítko se třemi tečkami (...) a zobrazit místní nabídku Kopírovat . Vyberte je, pokud chcete zkopírovat data zobrazená v obou oddílech do schránky.

Screenshot of the copy shortcut menu in the column statistics column.Snímek obrazovky s místní nabídkou kopírování ve sloupci statistiky sloupce

Seskupení podle hodnoty

Když vyberete tlačítko se třemi tečkou (...) v pravém horním rohu distribučního grafu hodnot, můžete vedle možnosti Kopírovat vybrat možnost Seskupit podle. Tato funkce seskupí hodnoty v grafu podle sady dostupných možností.

Screenshot of the copy and group by shortcut menu in the value distribution column.Snímek obrazovky s místní nabídkou kopírování a seskupení ve sloupci distribuce hodnot

Následující obrázek ukazuje sloupec názvů produktů seskupených podle délky textu. Po seskupení hodnot v grafu můžete pracovat s jednotlivými hodnotami v grafu, jak je popsáno v části Filtrovat podle hodnoty.

Screenshot of the new bar chart showing the distribution of the text length of store names in the table's Names column.Snímek obrazovky nového pruhového grafu zobrazující distribuci textové délky názvů obchodů ve sloupci Názvy tabulky