Dátové typy v Power Query

Dátové typy v Power Query sa používajú na klasifikáciu hodnôt s cieľom vytvoriť štruktúrovanejšiu dátovú sadu. Dátové typy sú definované na úrovni poľa—hodnoty vo vnútri poľa sa nastavujú tak, aby zodpovedali dátovému typu poľa.

Dátový typ stĺpca je zobrazený na ľavej strane nadpisu stĺpca s ikonou, ktorá symbolizuje dátový typ.

Snímka obrazovky zobrazujúca ikony bežných dátových typov zobrazené na ľavej strane nadpisu tabuľky v paneli náhľadu dát.

Nota

Power Query poskytuje súbor kontextových transformácií a možností založených na type dát v danom stĺpci. Napríklad, keď vyberiete stĺpec s dátovým typom Date, dostanete transformácie a možnosti, ktoré sa vzťahujú na tento konkrétny typ dát. Tieto transformácie a možnosti prebiehajú v celom rozhraní Power Query, napríklad na záložkách Transform a Add column a v nastaveniach smart filterov.

Najbežnejšie dátové typy používané v Power Query sú uvedené v nasledujúcej tabuľke. Hoci je to mimo rámec tohto článku, zoznam najčastejšie používaných dátových typov nájdete v článku Power Query M Typy a konverzia typov. V článku Types je tiež kompletný zoznam dátových typov v jazyku Power Query M.

Typ údajov Ikona Popis
Text Reťazec údajov znakov Unicode. Môže ísť o reťazce, čísla alebo dátumy zobrazené v textovom formáte. Maximálna dĺžka reťazca je 268 435 456 Unicode znakov (kde každý Unicode znak má 2 bajty) alebo 536 870 912 bajtov.
Pravda/Lož Booleovská hodnota buď Pravda alebo Nepravda.
Desatinné číslo Predstavuje 64-bitové (8-bajtové) číslo s pohyblivou desatinnou čiarkou. Ide o najbežnejší typ čísla a zodpovedá číslam, ako si ich zvyčajne predstavujeme. Napriek tomu, že je určené na spracovanie čísel s desatinnou hodnotou, spracúva aj celé čísla. Typ desatinného čísla dokáže spracovať záporné hodnoty od –1,79E +308 do –2,23E –308, 0 a kladné hodnoty od 2,23E –308 do 1,79E + 308. Napríklad čísla ako 34 34,01 a 34,000367063 sú platné desatinné čísla. Najväčšia presnosť, ktorú možno reprezentovať v type desatinného čísla, má 15 číslic. Oddeľovač desatinných miest sa môže nachádzať kdekoľvek v čísle. Typ desatinného čísla zodpovedá tomu, ako Excel ukladá svoje čísla. Binárne číslo s pohyblivou desatinnou čiarkou nemôže reprezentovať všetky čísla v podporovanom rozsahu s presnosťou 100%. Preto sa pri predstavujúcich určité desatinné čísla môžu vyskytnúť menšie rozdiely v presnosti.
Pevné desatinné číslo Tento typ údajov, známy aj ako typ meny, má pevne stanovené miesto pre desatinný oddeľovač. Oddeľovač desatinných miest má vždy štyri číslice vpravo a umožňuje 19 číslic. Najväčšia hodnota, ktorá môže predstavovať, je 922 337 203 685 477,5807 (kladná alebo záporná). Na rozdiel od desatinného čísla je typ pevného desatinného čísla vždy presný, a preto je užitočný v prípadoch, keď nepresnosť zápisu s pohyblivou desatinnou čiarkou môže spôsobiť chyby.
Celé číslo Predstavuje 64-bitovú (osembajtovú) celočíselnú hodnotu. Keďže ide o celé číslo, nemá žiadne číslice napravo od desatinnej čiarky. Umožňuje 19 číslic; kladné alebo záporné celé čísla medzi –9 223 372 036 854 775 808 (–2^63) a 9 223 372 036 854 775 807 (2^63–1). Môže predstavovať najväčšiu možnú presnosť pre rôzne typy číselných údajov. Rovnako ako pri type s pevným desatinným číslom, aj celý typ môže byť užitočný v prípadoch, keď potrebujete kontrolovať zaokrúhľovanie.
Percento V podstate je to rovnaké ako typ desatinného čísla, ale má masku na formátovanie hodnôt v stĺpci ako percento v okne Power Query Editor.
Dátum/Čas Predstavuje hodnotu dátumu aj času. Pod obalmi je hodnota dátumu/času uložená ako desatinné číslo, takže môžete medzi nimi skutočne prevádzať. Časová časť dátumu sa ukladá ako zlomok s celými násobkami 1/300 sekúnd (3,33 ms). Podporujú sa dátumy v rozmedzí od roku 1900 do roku 9999.
Dátum Predstavuje len dátum (bez časovej časti). Po prevedení do modelu je dátum rovnaký ako hodnota dátumu/času s nulou ako zlomková hodnota.
Čas Predstavuje len čas (bez dátumovej časti). Po prevedení do modelu je hodnota času rovnaká ako hodnota dátumu/času bez číslic vľavo od desatinného miesta.
Dátum/Čas/Časové pásmo Predstavuje UTC dátum/čas s časovým posunom. Pri načítaní do modelu sa to prevedie na dátum/čas.
Trvanie Predstavuje dĺžku času, ktorá sa pri načítaní do modelu prevedie na desatinné číslo. Ako typ desatinného čísla ho možno sčítať alebo odčítať z poľa dátumu/času s správnymi výsledkami. Keďže ide o typ desatinného čísla, môžete ho jednoducho použiť vo vizualizáciách, ktoré ukazujú veľkosť.
Binárny Binárny dátový typ môže byť použitý na reprezentáciu akýchkoľvek iných dát v binárnom formáte.
Akékoľvek Any dátový typ je stav pridelený stĺpcu, ktorý nemá explicitnú definíciu dátového typu. Any je dátový typ, ktorý klasifikuje všetky hodnoty. Odporúčame, aby ste vždy explicitne definovali dátové typy stĺpcov pre vaše dotazy z neštruktúrovaných zdrojov. Tiež sa vyhnite stĺpcom s dátovým typom Any ako výstupom vášho dotazu.

Detekcia dátových typov

Detekcia typu dát prebieha automaticky pri pripojení k:

  • Štruktúrované dátové zdroje, ako sú databázy, Power Query číta tabuľkovú schému zo zdroja dát a automaticky zobrazuje údaje použitím správneho dátového typu pre každý stĺpec.

  • Neštruktúrované zdroje ako Excel, CSV a textové súbory, Power Query automaticky deteguje dátové typy kontrolou hodnôt v tabuľke. Automatická detekcia dátových typov je predvolene povolená v Power Query pre neštruktúrované zdroje.

Môžete tiež použiť príkaz Detect data type v skupine Any column na karte Transform na automatickú detekciu dátových typov stĺpcov vo vašej tabuľke.

Snímka obrazovky príkazu detect data type na karte Transform.

Ako definovať dátový typ stĺpca

Dátový typ stĺpca môžete definovať alebo zmeniť na ktoromkoľvek zo štyroch miest:

  • Na karte Domov, v skupine Transform, v rozbaľovacom menu typu dát.

    Snímka obrazovky menu dátových typov na karte Domov.

  • Na karte Transform, v skupine stĺpcov Any, v rozbaľovacom menu typu dát.

    Snímka obrazovky menu dátových typov na karte Transformovať.

  • Výberom ikony na ľavej strane nadpisu stĺpca.

    Snímka obrazovky menu dátových typov v nadpise stĺpca.

  • V menu skratiek stĺpcov, pod Zmeniť typ.

    Screenshot príkazu na zmenu typu v menu skratiek stĺpcov.

Automatická detekcia typu dát stĺpca a hlavičiek

Toto nastavenie je určené špeciálne pre neštruktúrované zdroje. Pomáha vám automatickou kontrolou a detekciou typov stĺpcov a nadpisov na základe prvých 200 riadkov vašej tabuľky. Keď je toto nastavenie povolené, Power Query automaticky pridá dva kroky k vášmu dotazu:

  • Propagovať hlavičky stĺpcov: Povýši prvý riadok tabuľky na hlavičku stĺpca.
  • Zmenený typ: Prevádza hodnoty z ľubovoľného dátového typu na dátový typ na základe kontroly hodnôt z každého stĺpca.

Toto nastavenie je predvolene povolené. Ak chcete toto nastavenie vypnúť alebo povoliť, postupujte podľa krokov, ktoré sa vzťahujú na váš zážitok s Power Query.

Na konfiguráciu automatickej detekcie dátových typov v Power Query Online

Na záložke Home vyberte Options a potom zvoľte Data load pod možnosťami Project. Vyberte zaškrtávacie políčko Automaticky detegovať typy stĺpcov a hlavičky pre neštruktúrované zdroje .

Snímka obrazovky online možnosti automatickej detekcie dátových typov v projektových možnostiach.

Na konfiguráciu automatickej detekcie dátových typov v Power Query Desktop

Toto správanie môžete definovať na globálnej aj na úrovni jednotlivých súborov v okne Options (v Power Query editore, na záložke File vyberte Options and settings>Options).

  • Globálne: Na ľavom paneli pod Globálne vyberte Načítanie dát. V pravom paneli v sekcii Detekcia typov môžete vybrať jednu z troch konfigurácií detekcie typu, ktoré sa aplikujú na každý nový súbor vytvorený vo vašej aplikácii:

    • Vždy detegujte typy stĺpcov a hlavičky pre neštruktúrované zdroje
    • Detegujte typy stĺpcov a hlavičky pre neštruktúrované zdroje podľa nastavenia každého súboru
    • Nikdy nedetekujte typy stĺpcov a hlavičky pre neštruktúrované zdroje

    Snímka obrazovky možností na ploche na nastavenie globálnej detekcie typu.

  • Aktuálny súbor: Na ľavom paneli pod Aktuálny súbor vyberte Načítanie dát. Na pravom paneli v sekcii Detekcia typov vyberte, či chcete zapnúť alebo vypnúť detekciu typov pre aktuálny súbor.

    Snímka obrazovky možnosti automatickej detekcie dátového typu v Power Query Desktop.

Lokalita dokumentu alebo projektu

Power Query spracováva dve odlišné komponenty, ktoré riadia vzhľad a interpretáciu vecí:

  • Lokalizácia: komponent, ktorý hovorí Power Query, v akom jazyku by mal byť zobrazený.
  • Globalizácia: komponent, ktorý sa stará o formátovanie hodnôt, okrem interpretácie textových hodnôt.

Lokalita je jediná hodnota, ktorá obsahuje komponenty lokalizácie aj globalizácie. Locale sa používa na interpretáciu textových hodnôt a ich konverziu na iné dátové typy. Napríklad lokalita angličtina (United States) znamená, že lokalizácia je v United States angličtine a globalizácia, teda formát hodnoty, je založený na štandardoch používaných v United States.

Keď Power Query definuje dátový typ stĺpca alebo konvertuje z jedného dátového typu na iný, musí najprv interpretovať hodnoty, ktoré sa majú konvertovať, aby ich mohol premeniť na iný typ dát.

  • V Power Query Online je táto interpretácia definovaná v možnostiach Project pod Regionálne nastavenia.

    Snímka obrazovky nastavenia lokality v Power Query Online.

  • V Power Query Desktop Power Query automaticky rozpozná regionálny formát operačného systému a používa ho na interpretáciu hodnôt pre konverziu dátových typov. Na prepísanie tejto konfigurácie lokality otvorte okno Možnosti dotazu a v ľavom paneli pod Aktuálny súbor vyberte Regionálne nastavenia. Odtiaľ môžete zmeniť prostredie podľa vlastného nastavenia.

    Snímka obrazovky nastavenia lokality v Power Query Desktop.

Toto nastavenie lokality je dôležité pre interpretáciu textových hodnôt do konkrétneho dátového typu. Napríklad si predstavte, že máte nastavené prostredie ako angličtina (United States), ale stĺpec v jednom z vašich CSV súborov má dátumy formátované vo formáte Spojeného kráľovstva – deň/mesiac/rok.

Snímka obrazovky vzorovej pôvodnej tabuľky s dátumami v stĺpci Dátum nastavenými na britský formát deň, potom mesiac, potom rok.

Keď sa pokúsite nastaviť dátový typ stĺpca Dátum na Dátum, dostanete chybové hodnoty.

Snímka obrazovky chyby konverzie dátového typu.

Tieto chyby vznikajú, pretože použité miesto sa snaží interpretovať dátum v anglickom (United States) formáte, ktorý je mesiac/deň/rok. Keďže v kalendári nie je mesiac 22, spôsobuje to chybu.

Namiesto toho, aby ste sa snažili len vybrať dátový typ Date, môžete pravým kliknutím kliknúť na nadpis stĺpca, vybrať Zmeniť typ a potom zvoliť Použitie lokality.

Snímka obrazovky možnosti použitia lokality v menu skratiek stĺpcov.

V dialógovom okne Zmeniť typ stĺpca s lokalitou vyberiete dátový typ, ktorý chcete nastaviť, ale zároveň si vyberiete, ktoré lokalitu použiť, čo v tomto prípade musí byť angličtina (Spojené kráľovstvo).

Snímka obrazovky typu zmeny stĺpca s dialógom o lokalite.

Keď použijete túto lokalitu, Power Query dokáže správne interpretovať hodnoty a previesť ich na správny typ dát.

Snímka obrazovky finálnej tabuľky po použití lokality, s dátumami v stĺpci Dátum nastavenými na formát USA.

Na overenie konečných hodnôt dátumu

Hodnota globalizácie určuje formátovanie hodnôt dátumov. Ak máte akékoľvek pochybnosti o hodnote zobrazenej v Power Query, môžete si overiť konverziu hodnôt dátumu pridaním nových stĺpcov pre deň, mesiac a rok z hodnoty. Ak chcete pridať tieto nové stĺpce, vyberte stĺpec Dátum a prejdite na záložku Pridať stĺpec na páske. V skupine stĺpcov Dátum a čas sa zobrazujú možnosti pre stĺpec dátumu.

Snímka obrazovky ukazuje, ako vybrať časti hodnoty stĺpca dátumu, ktoré sa majú umiestniť do nového stĺpca.

Odtiaľ môžete vybrať časti hodnoty dátumu, ako je číslo roka, číslo mesiaca, číslo dňa alebo dokonca viac stĺpcov vybraných zo stĺpca Dátum .

Snímka obrazovky ukazujúca časti dátumu rozdelené na stĺpce rok, mesiac a deň.

Použitím týchto stĺpcov môžete overiť, že vaša hodnota dátumu bola správne prevedená.

Matica konverzie dátových typov

Nasledujúca matica je navrhnutá tak, aby vám poskytla rýchly pohľad na uskutočniteľnosť konverzie hodnoty z jedného dátového typu na druhý.

Nota

Konverzia v tejto matici začína pôvodným dátovým typom v stĺpci dátových typov . Každý výsledok konverzie na nový typ je zobrazený v riadku pôvodného dátového typu.

Typy údajov
Desatinné číslo
Mena
Celé číslo
Percento
Dátum/Čas
Dátum
Čas
Dátum/Čas/Časové pásmo
Trvanie
Text
Pravda/Lož
Ikona Popis
Možný
To nie je možné
Je to možné, ale pridáva to hodnoty k pôvodnej hodnote
Možné, ale skracuje pôvodnú hodnotu

Typy v Power Query M

Zoznam bežne používaných dátových typov nájdete v článku Power Query M Types and Type conversion. V článku Types je tiež kompletný zoznam dátových typov v jazyku Power Query M.