Jaa kautta


Tietojen profilointityökalujen käyttäminen

Tietojen profilointityökalut tarjoavat uusia ja intuitiivisia tapoja puhdistaa, muuntaa ja ymmärtää tietoja Power Query -editorissa. Niitä ovat muun muassa seuraavat:

  • Sarakkeen laatu

  • Sarakkeen jakelu

  • Sarakeprofiili

Jos haluat ottaa tietojen profilointityökalut käyttöön, siirry valintanauhan Näytä-välilehteen . Ota Power Query Desktopissa käyttöön haluamasi asetukset Tietojen esikatselu -ryhmässä seuraavassa kuvassa esitetyllä tavalla.

Screenshot of the Data profiling tools selected under the Power Query View tab.Näyttökuva tietojen profilointityökaluista, jotka on valittu Power Query -näkymän välilehdessä.

Valitse Power Query Onlinessa Tietonäkymä ja ota sitten haluamasi asetukset käyttöön avattavassa luettelossa.

Screenshot of the data profiling tools selected under Data view in the View tab.Näyttökuva tietojen profilointityökaluista, jotka on valittu Näytä-välilehden Tiedot-näkymässä.

Kun olet ottanut asetukset käyttöön, tietojen profilointitiedot näkyvät Power Query editorissa.

Screenshot of the data profiling tools after they're set up.Näyttökuva tietojen profilointityökaluista, kun ne on määritetty.

Muistiinpano

Oletusarvoisesti Power Query suorittaa tietojen profiloinnin tietoihisi yli 1 000 ensimmäisen rivin ajan. Jos haluat, että se toimii koko tietojoukossa, valitse Sarakkeen profilointi perustuu 1 000 rivin viestiin editorin ikkunan vasemmasta alakulmasta ja muuta sarakkeen profilointi sarakkeen profilointiksi koko tietojoukon perusteella.

Sarakkeen laatu

Sarakkeen laadun ominaisuusotsikoiden arvot viiden luokan riveillä:

  • Kelvollinen, näytetään vihreänä.

  • Virhe, näytetään punaisena.

  • Tyhjä, näytetään tummanharmaana.

  • Tuntematon, näytetään katkoviivanvihreänä. Ilmaisee, että sarakkeessa on virheitä, mutta jäljellä olevien tietojen laatua ei tunneta.

  • Odottamaton virhe, joka näkyy katkoviivana punaisena.

Nämä ilmaisimet näkyvät suoraan sarakkeen nimen alla osana pientä pylväskaaviota.

Screenshot of the enhanced view of the bar chart with data quality indicators and labels above each column in the table.Näyttökuva palkkikaavion parannetusta näkymästä, jossa on tietojen laadun ilmaisimet ja otsikot taulukon kunkin sarakkeen yläpuolella.

Kunkin sarakkeen laatuluokan tietueiden määrä näytetään myös prosenttilukuna.

Kun viet hiiren osoittimen minkä tahansa sarakkeen päälle, näet arvojen laadun numeerisen jakauman koko sarakkeessa. Lisäksi kolmen pisteen painikkeen (...) valitseminen avaa joitakin arvojen toimintojen pikatoimintopainikkeita.

Screenshot of the distribution of names column with 701 names valid (100 percent), zero errors and zero empty, with quick action commands displayed.Näyttökuva nimisarakkeen jakaumassa, jossa on kelvollisia 701 nimeä (100 prosenttia), nolla virhettä ja nolla tyhjä, pikatoimintokomennot näkyvissä.

Sarakkeen jakelu

Tämä ominaisuus tarjoaa joukon visualisointeja niiden sarakkeiden nimien alapuolelle, jotka esittelevät arvojen tiheyden ja jakautumisen kussakin sarakkeessa. Näiden visualisointien tiedot lajitellaan laskevassa järjestyksessä arvosta, jolla on suurin tiheys.

Screenshot of the data profiling tools with the upper column distribution emphasized.Näyttökuva tietojen profilointityökaluista, joissa on korostettu ylemmän sarakkeen jakauma.

Viemällä hiiren osoittimen minkä tahansa sarakkeen jakaumatietojen päälle saat tietoja sarakkeen kokonaistiedoista (erillisillä määräillä ja yksilöllisillä arvoilla). Distinct viittaa eri arvojen kokonaismäärään kussakin sarakkeessa. Yksilöllinen viittaa arvoihin, joiden sarakkeessa on vain yksi esiintymä. Voit myös valita kolmen pisteen painikkeen ja valita haluamasi valikon käytettävissä olevista toiminnoista.

Screenshot of the data profiling tools with the column distributions options emphasized.Näyttökuva tietojen profilointityökaluista, joissa on korostettu sarakejakaumien asetukset.

Sarakeprofiili

Tämän ominaisuuden avulla voit tarkastella tarkemmin sarakkeen tietoja. Pylväsjakaumakaavion lisäksi se sisältää pylvästilastokaavion. Nämä tiedot näkyvät tietojen esikatselun osassa.

Screenshot of the data profiling tool with the column profile emphasized.Näyttökuva tietojen profilointityökalusta, jossa on korostettu sarakeprofiili.

Suodata arvon mukaan

Voit käsitellä oikealla puolella olevaa arvojakauman kaaviota ja valita minkä tahansa palkeista viemällä hiiren osoittimen kaavion osien päälle.

Screenshot demonstrating how to hover over the bar in value distribution bar chart, which shows individual data for that bar.Näyttökuva, jossa näytetään, miten hiiren osoitin siirretään arvonjakauman palkkikaavion palkin päälle. Siinä näkyvät kyseisen palkin yksittäiset tiedot.

Napsauta hiiren kakkospainiketta, niin näet joukon käytettävissä olevia muunnoksia kyseiselle arvolle.

Screenshot demonstrating how to display the shortcut menu with available transformations for a single bar in the value distribution bar chart.Näyttökuva, jossa näytetään, miten pikavalikko voidaan näyttää yhdessä palkissa käytettävissä olevien muunnosten kanssa arvonjakauman palkkikaaviossa.

Kopioi tiedot

Voit valita kolmen pisteen painikkeen (...) sekä saraketilastojen että arvojen jakaumaosioiden oikeasta yläkulmasta, jolloin näkyviin tulee Kopioi pikakuvake -valikko. Valitse se, jos haluat kopioida jommassakummassa osassa näkyvät tiedot leikepöydälle.

Screenshot of the copy shortcut menu in the column statistics column.Näyttökuva kopioi pikakuvake -valikosta sarakkeen tilastosarakkeessa.

Ryhmittely arvon mukaan

Kun valitset arvonjakaumakaavion oikeassa yläkulmassa olevan kolmen pisteen painikkeen (...) Kopioi-kohdan lisäksi, voit valita Ryhmittelyperuste-vaihtoehdon. Tämä ominaisuus ryhmittelee kaavion arvot käytettävissä olevien vaihtoehtojen mukaan.

Screenshot of the copy and group by shortcut menu in the value distribution column.Näyttökuva arvonjakauman sarakkeen Kopioi ja ryhmittele pikakuvake -valikosta.

Seuraavassa kuvassa on sarake tuotenimistä, jotka on ryhmitelty tekstin pituuden mukaan. Kun arvot on ryhmitelty kaavioon, voit käsitellä kaavion yksittäisiä arvoja kohdassa Suodata arvon mukaan kuvatulla tavalla.

Screenshot of the new bar chart showing the distribution of the text length of store names in the table's Names column.Näyttökuva uudesta palkkikaaviosta, joka näyttää myymälöiden nimien tekstin pituuden jakauman taulukon Nimet-sarakkeessa.