Power Queryn tietotyypit
Power Queryn tietotyyppejä käytetään arvojen luokittelemiseen jäsennellymmän tietojoukon määrittämiseksi. Tietotyypit määritetään kenttätasolla – kentän sisäiset arvot on määritetty vastaamaan kentän tietotyyppiä.
Sarakkeen tietotyyppi näkyy sarakeotsikon vasemmalla puolella tietotyyppiä symboloivalla kuvakkeella.
Huomautus
Power Query tarjoaa joukon tilannekohtaisia muunnoksia ja asetuksia sarakkeen tietotyypin perusteella. Kun esimerkiksi valitset sarakkeen, jonka tietotyyppi on Päivämäärä, saat kyseiseen tietotyyppiin liittyviä muunnoksia ja asetuksia. Nämä muunnokset ja asetukset suoritetaan Power Query -käyttöliittymässä, esimerkiksi Muunna - ja Lisää sarake -välilehdissä ja älykkäissä suodatinasetuksissa.
Yleisimmät Power Queryssä käytetyt tietotyypit on lueteltu seuraavassa taulukossa. Vaikka tämän artikkelin alueen lisäksi löydät täydellisen tietotyyppiluettelon Power Query M -kaavakielityypit-artikkelista.
Tietotyyppi | Icon | Kuvaus |
---|---|---|
Teksti | Unicode-merkkitietomerkkijono. Voi olla merkkijono, numero tai päivämäärä, joka on esitetty tekstimuodossa. Merkkijonon enimmäispituus on 268 435 456 Unicode-merkkiä (joissa jokainen Unicode-merkki on kaksi tavua) tai 536 870 912 tavua. | |
Tosi/epätosi | Totuusarvo tosi tai epätosi. | |
Desimaaliluku | Edustaa 64-bittistä (kahdeksantavuista) liukulukua. Se on yleisin lukutyyppi ja vastaa lukuja sellaisena kuin yleensä ajattelet niitä. Vaikka se on suunniteltu käsittelemään murtolukuja sisältäviä arvoja, se käsittelee myös kokonaislukuja. Desimaalilukutyyppi pystyy käsittelemään negatiivisia arvoja väliltä –1,79E +308 ja –2,23E –308, 0, ja positiivisia arvoja väliltä 2,23E–308 ja 1,79E + 308. Esimerkiksi luvut 34, 34,01 ja 34,000367063 ovat kelvollisia desimaalilukuja. Suurin tarkkuus, joka voidaan esittää desimaalilukutyyppinä, on 15 numeroa pitkä. Desimaalierotin voi ilmetä missä tahansa luvun kohdassa. Desimaalilukutyyppi vastaa sitä, miten Excel tallentaa sen luvut. Huomaa, että binaarinen liukuluku ei voi edustaa kaikkia lukuja tuetulla alueella 100 prosentin tarkkuudella. Näin ollen pieniä eroja tarkkuudella voi ilmetä, kun edustavat tiettyjä desimaalilukuja. | |
Kiinteä desimaaliluku | Tätä tietotyyppiä kutsutaan myös Valuutta-tyypiksi, ja siinä on kiinteä sijainti desimaalierottimelle. Desimaalierottimen oikealla puolella on aina neljä numeroa, ja siinä voi olla 19 merkitsevyyttä olevaa numeroa. Suurin arvo, jota se voi edustaa, on 922 337 203 685 477,5807 (positiivinen tai negatiivinen). Toisin kuin desimaaliluku, kiinteä desimaalilukutyyppi on aina tarkka, joten siitä on hyötyä tilanteissa, joissa liukulukujen merkintävirheet saattavat aiheuttaa virheitä. | |
Ken luku | Edustaa 64-bittistä (kahdeksantavuista) kokonaislukuarvoa. Koska kyseessä on kokonaisluku, sillä ei ole numeroita desimaalipilkun oikealla puolella. Siinä voi olla 19 numeroa. positiiviset tai negatiiviset kokonaisluvut välillä –9 223 372 036 854 775 807 (–2^63+1) ja 9 223 372 036 854 775 806 (2^63–2). Se voi edustaa eri numeeristen tietotyyppien suurinta mahdollista tarkkuutta. Kuten kiinteän desimaalilukutyypin kohdalla, myös Ken numerotyypistä voi olla hyötyä tilanteissa, joissa sinun on hallittava pyöristystä. | |
Prosentti | Periaatteessa sama kuin desimaalilukutyyppi, mutta sillä on rajoite, jolla sarakkeen arvot muotoillaan prosenttilukuna Power Query -editori-ikkunassa. | |
Päivämäärä ja aika | Edustaa sekä päivämäärä- että aika-arvoa. Kansien alapuolella Päivämäärä/aika-arvo tallennetaan desimaalilukutyyppinä, joten voit todellisuudessa muuntaa näiden kahden välillä. Päivämäärän aikaosa tallennetaan murtolukuna 1/300 sekunnin (3,33 ms) kokonaislukukertojen mukaan. Päivämääriä vuosien 1900–9 9999 välillä tuetaan. | |
Päivämäärä | Edustaa vain päivämäärää (ei aikaosaa). Malliin muunnettaessa päivämäärä on sama kuin päivämäärän/ajan arvo, jonka murtolukuarvo on nolla. | |
Time | Edustaa vain aikaa (ei päivämääräosaa). Malliin muunnettaessa ajan arvo on sama kuin päivämäärän/ajan arvo, jonka desimaalierottimessa ei ole numeroita. | |
Päivämäärä, aika ja aikavyöhyke | Edustaa UTC-päivämäärää/-aikaa ja aikavyöhykkeen siirtymää. Se muunnetaan malliin lataamisen yhteydessä päivämääräksi/ajaksi. | |
Kesto | Edustaa ajan pituutta, joka muunnetaan desimaalilukutyypiksi, kun se ladataan malliin. Desimaalilukutyyppinä se voidaan lisätä tai vähentää Päivämäärä/aika-kentästä oikeilla tuloksilla. Koska kyseessä on desimaalilukutyyppi, voit helposti käyttää sitä visualisoinneissa, jotka näyttävät suuruusluokan. | |
Binary | Binaaritietotyyppiä voidaan käyttää edustamaan muita binaarimuotoisia tietoja. | |
Any | Mikä tahansa tietotyyppi on sarakkeelle annettu tila, jolla ei ole eksplisiittistä tietotyyppimääritystä. Mikä tahansa on tietotyyppi, joka luokittelee kaikki arvot. Suosittelemme, että määrität aina eksplisiittisesti kyselyiden saraketietotyypit rakenteettomista lähteistä ja vältät sitä, että sinulla on mitä tahansa tietotyyppiä sisältäviä sarakkeita kyselyn tuloksena. |
Tietotyypin tunnistaminen tapahtuu automaattisesti, kun muodostetaan yhteys:
Rakenteiset tietolähteet, kuten tietokannat, Power Query lukee taulukon rakenteen tietolähteestä ja näyttää tiedot automaattisesti käyttämällä oikeaa tietotyyppiä kussakin sarakkeessa.
Rakenteettomat lähteet, kuten Excel, CSV ja tekstitiedostot, Power Query tunnistaa tietotyypit automaattisesti tarkistamalla taulukon arvot. Oletusarvoisesti automaattinen tietotyypin havaitseminen on käytössä Power Queryssä jäsentämättömissä lähteissä.
Voit myös tunnistaa taulukon sarakkeiden tietotyypit automaattisesti käyttämällä Tunnista tietotyyppi -komentoa Mikä tahansa sarake -ryhmässä Muunna-välilehdellä .
Voit määrittää tai muuttaa sarakkeen tietotyyppiä neljässä paikassa:
Valitse Aloitus-välilehden avattavan Tietotyyppi-valikon Muunna-ryhmästä.
Valitse Muunna-välilehden Mikä tahansa sarake -ryhmän avattavasta Tietotyyppi-valikosta.
Valitsemalla kuvakkeen sarakeotsikon vasemmalta puolelta.
Valitse sarakkeen pikavalikosta Muuta tyyppiä.
Tämä asetus on tarkoitettu erityisesti rakenteettomille lähteille. Sen avulla voit tarkistaa ja tunnistaa saraketyypit ja otsikot automaattisesti taulukon 200 ensimmäisen rivin perusteella. Kun tämä asetus on käytössä, Power Query lisää kyselyyn automaattisesti kaksi vaihetta:
- Ylennä sarakeotsikot: Korottaa taulukon ensimmäisen rivin sarakeotsikoksi.
- Muutettu tyyppi: muuntaa Arvot Mistä tahansa tietotyypistä tietotyypiksi perustuen kunkin sarakkeen arvojen tarkastukseen.
Tämä asetus on otettu oletusarvoisesti käyttöön. Jos haluat poistaa tämän asetuksen käytöstä tai ottaa sen käyttöön, toimi niiden ohjeiden mukaisesti, jotka koskevat Power Query -käyttökokemustasi.
Automaattisen tietotyypin tunnistuksen määrittäminen Power Query Onlinessa
Valitse Aloitus-välilehdessä Asetukset ja valitse sitten Projektiasetukset. Valitse Projektiasetukset-ikkunassa Tunnista rakenteettomien lähteiden saraketyypit ja otsikot automaattisesti -valintaruutu.
Automaattisen tietotyypin tunnistuksen määrittäminen Power Query for Desktopissa
Voit määrittää tämän toiminnan sekä yleinen-tasolla että tiedostokohtaisessa tasossa Asetukset-ikkunassa (Power Query -editori Tiedosto-välilehdessä Vaihtoehdot ja vaihtoehdot>).
Yleinen: Valitse vasemmassa ruudussa Yleinen ja valitse Tietojen lataaminen. Oikeanpuoleisen ruudun Tyypin havaitseminen -kohdassa voit valita minkä tahansa kolmesta tyypintunnistusmäärityksestä, joita sovelletaan jokaiseen sovelluksessasi luotuun uuteen tiedostoon:
- Tunnista aina rakenteettomien lähteiden saraketyypit ja otsikot
- Tunnista rakenteettomien lähteiden saraketyypit ja otsikot kunkin tiedoston asetuksen mukaisesti
- Älä koskaan tunnista rakenteettomien lähteiden saraketyyppejä ja otsikoita
Nykyinen tiedosto: Valitse vasemmanpuoleisessa ruudussa Nykyinen tiedosto, valitse Tietojen lataaminen. Valitse oikeanpuoleisessa ruudussa Tyypin havaitseminen -kohdassa, haluatko ottaa käyttöön tai poistaa käytöstä tyypintunnistuksen nykyiselle tiedostolle.
Power Query käsittelee kaksi erillistä osaa, jotka hallitsevat asioiden ulkoasua ja tulkintaa:
- Lokalisointi: komponentti, joka kertoo Power Querylle, millä kielellä se tulisi näyttää.
- Globalization: komponentti, joka käsittelee arvojen muotoilun tekstiarvojen tulkinnan lisäksi.
Kieliasetus on yksittäinen arvo, joka sisältää sekä lokalisointi- että globalisointiosat. Kieliasetusten avulla tulkitaan tekstiarvoja ja muunnetaan ne muihin tietotyyppeihin. Esimerkiksi kieliasetusten englanti (Yhdysvallat) tarkoittaa, että lokalisointi on englanninkielistä Yhdysvallat ja että arvon globalisointi eli muoto perustuu Yhdysvallat käytettyihin standardeihin.
Kun Power Query määrittää sarakkeen tietotyypin tai muuntaa yhden tietotyypin toiseksi, sen on tulkittava muunnettavat arvot, ennen kuin se voi muuntaa ne eri tietotyypiksi.
Power Query Onlinessa tämä tulkinta on määritetty Projektiasetukset-kohdan Aluekohtaiset asetukset -kohdassa.
Power Query for Desktopissa Power Query tunnistaa automaattisesti käyttöjärjestelmäsi alueellisen muodon ja käyttää sitä tietotyyppimuunnoksen arvojen tulkintaan. Jos haluat ohittaa tämän aluekohtaista määritystä, avaa Kyselyasetukset-ikkuna ja valitse vasemmassa ruudussa Nykyinen tiedosto -kohdassa Aluekohtaiset asetukset. Täältä voit muuttaa aluekohtaisia tietoja haluamaksesi asetukseksi.
Tämä aluekohtainen asetus on tärkeä tekstiarvojen tulkitsemisessa tiettyyn tietotyyppiin. Kuvitellaan esimerkiksi, että aluekohtaisiksi asetuksiksi on määritetty englanti (Yhdysvallat), mutta yhden CSV-tiedostosi sarakkeen päivämäärät on muotoiltu Yhdistyneessä kuningaskunnassa muotoon päivä/kuukausi/vuosi.
Kun yrität määrittää Päivämäärä-sarakkeen tietotyypiksi Päivämäärä, saat virhearvoja.
Nämä virheet ilmenevät, koska käytetty aluekohtainen asetus yrittää tulkita päivämäärää englanninkielisessä muodossa (Yhdysvallat), joka on kuukausi/päivä/vuosi. Kalenterissa ei ole kuukautta 22, mikä aiheuttaa virheen.
Sen sijaan, että yrittäisit vain valita Päivämäärä-tietotyypin, voit napsauttaa sarakeotsikkoa hiiren kakkospainikkeella, valita Muuta tyyppiä ja valita sitten Käytetään aluekohtaisia tietoja.
Vaihda saraketyyppiä aluekohtaisilla asetuksissa valitset tietotyypin, jonka haluat määrittää. Valitset kuitenkin myös käytettävät aluekohtaiset asetukset, joiden täytyy tässä tapauksessa olla englanti (Yhdistynyt kuningaskunta).
Käyttämällä tätä aluekohtaista asetusta Power Query pystyy tulkitsemaan arvot oikein ja muuntamaan nämä arvot oikeaksi tietotyypiksi.
Lopullisten päivämääräarvojen tarkistaminen
Arvojen muotoiluun perustuu globalisointiarvo. Jos sinulla on epäilyksiä Power Queryn näyttämästä arvosta, voit varmistaa päivämääräarvojen muunnoksen lisäämällä arvosta uusia sarakkeita päivälle, kuukaudelle ja vuodelle. Voit tehdä tämän valitsemalla Päivämäärä-sarakkeen ja siirtymällä valintanauhan Lisää sarake -välilehteen. Päivämäärä ja aika -sarakeryhmässä näkyvät päivämääräsarakkeen asetukset.
Tästä näkymästä voit poimia päivämääräarvon osat, kuten vuoden numeron, kuukauden numeron, päivänumeron tai monia muita Päivämäärä-sarakkeesta poimittuja sarakkeita.
Käyttämällä näitä sarakkeita voit varmistaa, että päivämääräarvo on muunnettu oikein.
Seuraava matriisi on suunniteltu niin, että saat nopean katsauksen arvon tietotyypin muuntamisen toteutettavuudesta tietotyypistä toiseen.
Huomautus
Tämän matriisin muunto alkaa tietotyyppisarakkeen alkuperäisellä tietotyypillä. Jokainen muunnoksen tulos uudeksi tyypiksi näkyy alkuperäisen tietotyypin rivillä.
Tietotyypit | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Desimaaliluku | — | ||||||||||
Valuutta | — | ||||||||||
Ken luku | — | ||||||||||
Prosenttiosuus | — | ||||||||||
Päivämäärä ja aika | — | ||||||||||
Päivämäärä | — | ||||||||||
Aika | — | ||||||||||
Päivämäärä, aika ja aikavyöhyke | — | ||||||||||
Kesto | — | ||||||||||
Teksti | — | ||||||||||
Tosi/epätosi | — |
Icon | Kuvaus |
---|---|
Mahdollista | |
Ei ole mahdollista | |
Mahdollista, mutta se lisää arvoja alkuperäiseen arvoon | |
Mahdollista, mutta se katkaisee alkuperäisen arvon |