Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Platí pro:
Databricks SQL
Databricks Runtime
V Azure Databricks existuje několik běžných scénářů použití data a času:
- Zdroje dat CSV a JSON používají vzorový řetězec k analýze a formátování obsahu data a času.
- Funkce data a času související s převodem
STRINGna nebo zDATEneboTIMESTAMP. Příklad:
Vzorová tabulka
Azure Databricks používá vzorová písmena v následující tabulce pro parsování a formátování data a časového razítka:
| Symbol | Význam | Prezentace | Příklady |
|---|---|---|---|
| G | éra | poslat SMS | LP; Léta Páně |
| y | rok | rok | 2020; 20 |
| D | den v roce | číslo (3) | 189 |
| M/L | měsíc v roce | měsíc | 7; 07; Červenec; Červenec |
| d | den měsíce | číslo (3) | 28 |
| Q/q | čtvrtletí roku | číslo/text | 3; 03; 3. čtvrtletí; 3. čtvrtletí |
| E | den v týdnu | poslat SMS | Út; Úterý |
| F | zarovnaný den týdne v měsíci | číslo(1) | 3 |
| a | režim dne AM/PM | dopoledne-odpoledne | premiér |
| h | hodina dopoledne nebo odpoledne (1-12) | číslo(2) | 12 |
| K | hodina odpoledne (0–11) | číslo(2) | 0 |
| k | hodina dne (1–24) | číslo(2) | 0 |
| H | hodina dne (0–23) | číslo(2) | 0 |
| m | minuta v hodině | číslo(2) | 30 |
| s | sekunda za minutu | číslo(2) | 55 |
| S | zlomek sekundy | zlomek | 978 |
| V | ID časového pásma | ID zóny | Amerika/Los_Angeles; Z; -08:30 |
| z | název časového pásma | název zóny | Tichomořský běžný čas; PST |
| O | lokalizované odsazení časového pásma | offset-O | GMT+8; GMT+08:00; UTC-08:00; |
| X | odsazení zóny 'Z' pro nulu | offset-X | Z; -08; -0830; -08:30; -083015; -08:30:15; |
| x | časový posun zóny | offset-x | +0000; -08; -0830; -08:30; -083015; -08:30:15; |
| Z | časový posun zóny | offset-Z | +0000; -0800; -08:00; |
| ' | únik pro text | oddělovač | |
| '' | jednoduchá uvozovka | literál | ' |
| [ | volitelný začátek oddílu | ||
| ] | volitelný konec sekce |
Počet vzorových písmen určuje formát.
Text: Styl textu je určen na základě počtu použitých vzorových písmen. Pokud jsou používána méně než čtyři vzorová písmena, bude použita krátká textová forma, obvykle zkratka, například pondělí se může zobrazit jako "Mon". Přesně 4 vzorová písmena budou používat plnou textovou formu, obvykle úplný popis, například den v týdnu pondělí může vypisovat "Pondělí". 5 nebo více písmen selže.
Number(n): N zde představuje maximální počet písmen, pro který lze použít tento typ vzorce data a času. Pokud je počet písmen jeden, hodnota je zobrazena s nejmenším počtem číslic a bez vyplnění. V opačném případě se počet číslic použije jako šířka výstupního pole a hodnota se podle potřeby doplní nulami.
Číslo/text: Pokud je počet vzorových písmen 3 nebo větší, použijte výše uvedená pravidla textu. Jinak použijte výše uvedená pravidla číslování.
Zlomek: K analýze a formátování zlomku sekundy, například, použijte jeden nebo více (až 9) souvislých znaků
'S', jako jeSSSSSS. Pro analýzu může být přijatelná délka zlomku [1, počet souvislých 'S']. Pro formátování by byla délka zlomku upravena tak, aby odpovídala počtu souvisle za sebou jdoucích "S", s doplněním nul. Azure Databricks podporuje datum a čas s mikrosekundovou přesností, která má až 6 významných číslic, ale dokáže parsovat nano-of-sekundu, přičemž překročená část je zkrácena.Rok: Počet písmen určuje minimální šířku pole, pod kterou se používá odsazení. Pokud je počet písmen dva, použije se zkrácený dvoumístný formulář. Při tisku se tím vytisknou dvě nejpravější číslice. Při analýze se parsuje pomocí základní hodnoty 2000, což vede k roku v rozsahu 2000 až 2099 včetně. Pokud je počet písmen menší než čtyři (ale ne dva), je znaménko výstupem pouze pro záporné roky. V opačném případě se znaménko zobrazí, pokud je překročena šířka výplně a znak G není přítomen. 7 nebo více písmen selže.
Měsíc: Řídí se pravidlem číslo/text. Textový formulář je závislý na písmenech –
'M'označuje "standardní" formulář a'L'je určen pro samostatný formulář. Tyto dvě formy se liší pouze v některých určitých jazycích. Například v ruštině je "Июль" samostatnou formou července a "Июля" je standardní forma. Tady jsou příklady pro všechna podporovaná vzorová písmena:'M'nebo'L': Číslo měsíce v roce od 1. Mezi'M'a'L'není žádný rozdíl. Měsíce od 1 do 9 jsou vytištěny bez padování.> SELECT date_format(date '1970-01-01', 'M'); 1 > SELECT date_format(date '1970-12-01', 'L'); 12'MM'nebo'LL': Číslo měsíce v roce od 1. Nulové odsazení se přidá po dobu měsíců 1–9.> SELECT date_format(date '1970-1-01', 'LL'); 01 > SELECT date_format(date '1970-09-01', 'MM'); 09'MMM': Krátká textová reprezentace ve standardní podobě. Vzor měsíce by měl být součástí vzorce pro datum, nejen samostatným měsícem, s výjimkou lokalit, v nichž není rozdíl mezi obyčejnými a samostatnými formami, jako v angličtině.> SELECT date_format(date '1970-01-01', 'd MMM'); 1 Jan -- Passing a format pattern to to_csv() > SELECT to_csv(named_struct('date', date '1970-01-01'), map('dateFormat', 'dd MMM', 'locale', 'RU')); 01 янв.'MMMM': úplné textové zobrazení měsíce ve standardním formátu. Používá se k analýze a formátování měsíců jako součást kalendářních dat a časových razítek.> SELECT date_format(date '1970-01-01', 'd MMMM'); 1 January -- Passing a format pttern to to_csv() > SELECT to_csv(named_struct('date', date '1970-01-01'), map('dateFormat', 'd MMMM', 'locale', 'RU')); 1 января
am-pm: Výstupem je am-pm-of-day. Počet vzorových písmen musí být 1.
ID zóny(V): Zobrazí se ID časového pásma. Počet vzorových písmen musí být 2.
Názvy zón(z): Výstupem je zobrazovaný textový název ID časového pásma. Pokud je počet písmen jeden, dva nebo tři, je krátký název výstupem. Pokud je počet písmen čtyři, zobrazí se celý název. Pět nebo více písmen selže.
Posun X a x: Tento formátuje posun na základě počtu písmen v šabloně. Jedno písmeno vypíše pouze hodinu, například +01, pokud minuta není nulová, v takovém případě se minuta také zobrazí jako výstup, například +0130. Dvě písmena vypisují hodinu a minutu bez dvojtečky, například +0130. Tři písmena vypisují hodinu a minutu s dvojtečkou, například "+01:30". Čtyři písmena vypíše hodinu a minutu a volitelnou sekundu bez dvojtečky, například +013015. Pět písmen zobrazuje hodinu a minutu a volitelnou sekundu s dvojtečkou, například '+01:30:15'. Šest nebo více písmen selže. Vzorové písmeno X (velké písmeno) bude výstupem "Z", pokud posun na výstup bude nula, zatímco písmeno vzoru x (malé) bude výstupem +00, +0000 nebo +00:00.
Posun O: Tento formát určuje lokalizovaný posun podle počtu vzorových písmen. Jedno písmeno vyjadřuje zkrácenou formu lokalizovaného časového posunu, což je text jako 'GMT', kde hodiny jsou bez úvodní nuly, a volitelné dvouciferné minuty a sekundy, pokud nejsou nulové, oddělené dvojtečkou, například 'GMT+8'. Čtyři písmena zobrazí celý název, což je lokalizovaný text posunu, například 'GMT', s dvouciferným údajem hodiny a minuty, volitelným druhým údajem pro sekundy, pokud nejsou nulové, a dvojtečkou, například 'GMT+08:00'. Jakýkoliv jiný počet písmen selže.
Odsazení Z: Naformátuje posun na základě počtu vzorových písmen. Jedna, dvě nebo tři písmena vypíše hodinu a minutu bez dvojtečky, například +0130. Výstup je +0000, když je posun nula. Čtyři písmena poskytují úplný tvar lokalizovaného offsetu, který odpovídá čtyřem písmenům Offset-O. Výstup je odpovídající lokalizovaný posun textu, pokud je posun nula. Výstup ve formě pěti znaků zobrazuje hodinu, minutu a volitelně sekundu, pokud není nulová, s dvojtečkou jako oddělovačem. Výstupem je "Z", pokud je posun nula. Šest nebo více písmen selže.
Volitelný začátek a konec oddílu: Použijte
[]k definování volitelného oddílu, který může být i vnořený. Při formátování jsou všechna platná data výstupem, i když jsou v volitelné části. Během analýzy může v analyzovaném řetězci chybět celý oddíl. Volitelný oddíl je zahájen[a ukončen pomocí](nebo na konci šablony).Symboly "E", "F", "q" a "Q" lze použít pouze pro formátování data a času, například
date_format. Nejsou povoleny pro parsování data a času, např.to_timestamp.