Vzory pro datum a čas

Platí pro: ano, zaškrtnuto Databricks SQL Databricks Runtime

V Azure Databricks existuje několik běžných scénářů použití data a času:

Zdroje dat CSV a JSON používají vzorový řetězec k analýze a formátování obsahu data a času.
Funkce data a času související s převodem STRING na nebo z DATE nebo TIMESTAMP. Příklad:

Vzorová tabulka

Azure Databricks používá vzorová písmena v následující tabulce pro parsování a formátování data a časového razítka:

Symbol	Význam	Prezentace	Příklady
G	éra	poslat SMS	LP; Léta Páně
y	rok	rok	2020; 20
D	den v roce	číslo (3)	189
M/L	měsíc v roce	měsíc	7; 07; Červenec; Červenec
d	den měsíce	číslo (3)	28
Q/q	čtvrtletí roku	číslo/text	3; 03; 3. čtvrtletí; 3. čtvrtletí
E	den v týdnu	poslat SMS	Út; Úterý
F	zarovnaný den týdne v měsíci	číslo(1)	3
a	režim dne AM/PM	dopoledne-odpoledne	premiér
h	hodina dopoledne nebo odpoledne (1-12)	číslo(2)	12
K	hodina odpoledne (0–11)	číslo(2)	0
k	hodina dne (1–24)	číslo(2)	0
H	hodina dne (0–23)	číslo(2)	0
m	minuta v hodině	číslo(2)	30
s	sekunda za minutu	číslo(2)	55
S	zlomek sekundy	zlomek	978
V	ID časového pásma	ID zóny	Amerika/Los_Angeles; Z; -08:30
z	název časového pásma	název zóny	Tichomořský běžný čas; PST
O	lokalizované odsazení časového pásma	offset-O	GMT+8; GMT+08:00; UTC-08:00;
X	odsazení zóny 'Z' pro nulu	offset-X	Z; -08; -0830; -08:30; -083015; -08:30:15;
x	časový posun zóny	offset-x	+0000; -08; -0830; -08:30; -083015; -08:30:15;
Z	časový posun zóny	offset-Z	+0000; -0800; -08:00;
'	únik pro text	oddělovač
''	jednoduchá uvozovka	literál	'
[	volitelný začátek oddílu
]	volitelný konec sekce

Počet vzorových písmen určuje formát.

Text: Styl textu je určen na základě počtu použitých vzorových písmen. Pokud jsou používána méně než čtyři vzorová písmena, bude použita krátká textová forma, obvykle zkratka, například pondělí se může zobrazit jako "Mon". Přesně 4 vzorová písmena budou používat plnou textovou formu, obvykle úplný popis, například den v týdnu pondělí může vypisovat "Pondělí". 5 nebo více písmen selže.
Number(n): N zde představuje maximální počet písmen, pro který lze použít tento typ vzorce data a času. Pokud je počet písmen jeden, hodnota je zobrazena s nejmenším počtem číslic a bez vyplnění. V opačném případě se počet číslic použije jako šířka výstupního pole a hodnota se podle potřeby doplní nulami.
Číslo/text: Pokud je počet vzorových písmen 3 nebo větší, použijte výše uvedená pravidla textu. Jinak použijte výše uvedená pravidla číslování.
Zlomek: K analýze a formátování zlomku sekundy, například, použijte jeden nebo více (až 9) souvislých znaků 'S', jako je SSSSSS. Pro analýzu může být přijatelná délka zlomku [1, počet souvislých 'S']. Pro formátování by byla délka zlomku upravena tak, aby odpovídala počtu souvisle za sebou jdoucích "S", s doplněním nul. Azure Databricks podporuje datum a čas s mikrosekundovou přesností, která má až 6 významných číslic, ale dokáže parsovat nano-of-sekundu, přičemž překročená část je zkrácena.
Rok: Počet písmen určuje minimální šířku pole, pod kterou se používá odsazení. Pokud je počet písmen dva, použije se zkrácený dvoumístný formulář. Při tisku se tím vytisknou dvě nejpravější číslice. Při analýze se parsuje pomocí základní hodnoty 2000, což vede k roku v rozsahu 2000 až 2099 včetně. Pokud je počet písmen menší než čtyři (ale ne dva), je znaménko výstupem pouze pro záporné roky. V opačném případě se znaménko zobrazí, pokud je překročena šířka výplně a znak G není přítomen. 7 nebo více písmen selže.
Měsíc: Řídí se pravidlem číslo/text. Textový formulář je závislý na písmenech – 'M' označuje "standardní" formulář a 'L' je určen pro samostatný formulář. Tyto dvě formy se liší pouze v některých určitých jazycích. Například v ruštině je "Июль" samostatnou formou července a "Июля" je standardní forma. Tady jsou příklady pro všechna podporovaná vzorová písmena:
- 'M' nebo 'L': Číslo měsíce v roce od 1. Mezi 'M' a 'L' není žádný rozdíl. Měsíce od 1 do 9 jsou vytištěny bez padování.
```
> SELECT date_format(date '1970-01-01', 'M');
  1

> SELECT date_format(date '1970-12-01', 'L');
  12
```
- 'MM' nebo 'LL': Číslo měsíce v roce od 1. Nulové odsazení se přidá po dobu měsíců 1–9.
```
> SELECT date_format(date '1970-1-01', 'LL');
  01

> SELECT date_format(date '1970-09-01', 'MM');
  09
```
- 'MMM': Krátká textová reprezentace ve standardní podobě. Vzor měsíce by měl být součástí vzorce pro datum, nejen samostatným měsícem, s výjimkou lokalit, v nichž není rozdíl mezi obyčejnými a samostatnými formami, jako v angličtině.
```
> SELECT date_format(date '1970-01-01', 'd MMM');
  1 Jan

-- Passing a format pattern to to_csv()
> SELECT to_csv(named_struct('date', date '1970-01-01'), map('dateFormat', 'dd MMM', 'locale', 'RU'));
  01 янв.
```
- 'MMMM': úplné textové zobrazení měsíce ve standardním formátu. Používá se k analýze a formátování měsíců jako součást kalendářních dat a časových razítek.
```
> SELECT date_format(date '1970-01-01', 'd MMMM');
  1 January

-- Passing a format pttern to to_csv()
> SELECT to_csv(named_struct('date', date '1970-01-01'), map('dateFormat', 'd MMMM', 'locale', 'RU'));
  1 января
```
am-pm: Výstupem je am-pm-of-day. Počet vzorových písmen musí být 1.
ID zóny(V): Zobrazí se ID časového pásma. Počet vzorových písmen musí být 2.
Názvy zón(z): Výstupem je zobrazovaný textový název ID časového pásma. Pokud je počet písmen jeden, dva nebo tři, je krátký název výstupem. Pokud je počet písmen čtyři, zobrazí se celý název. Pět nebo více písmen selže.
Posun X a x: Tento formátuje posun na základě počtu písmen v šabloně. Jedno písmeno vypíše pouze hodinu, například +01, pokud minuta není nulová, v takovém případě se minuta také zobrazí jako výstup, například +0130. Dvě písmena vypisují hodinu a minutu bez dvojtečky, například +0130. Tři písmena vypisují hodinu a minutu s dvojtečkou, například "+01:30". Čtyři písmena vypíše hodinu a minutu a volitelnou sekundu bez dvojtečky, například +013015. Pět písmen zobrazuje hodinu a minutu a volitelnou sekundu s dvojtečkou, například '+01:30:15'. Šest nebo více písmen selže. Vzorové písmeno X (velké písmeno) bude výstupem "Z", pokud posun na výstup bude nula, zatímco písmeno vzoru x (malé) bude výstupem +00, +0000 nebo +00:00.
Posun O: Tento formát určuje lokalizovaný posun podle počtu vzorových písmen. Jedno písmeno vyjadřuje zkrácenou formu lokalizovaného časového posunu, což je text jako 'GMT', kde hodiny jsou bez úvodní nuly, a volitelné dvouciferné minuty a sekundy, pokud nejsou nulové, oddělené dvojtečkou, například 'GMT+8'. Čtyři písmena zobrazí celý název, což je lokalizovaný text posunu, například 'GMT', s dvouciferným údajem hodiny a minuty, volitelným druhým údajem pro sekundy, pokud nejsou nulové, a dvojtečkou, například 'GMT+08:00'. Jakýkoliv jiný počet písmen selže.
Odsazení Z: Naformátuje posun na základě počtu vzorových písmen. Jedna, dvě nebo tři písmena vypíše hodinu a minutu bez dvojtečky, například +0130. Výstup je +0000, když je posun nula. Čtyři písmena poskytují úplný tvar lokalizovaného offsetu, který odpovídá čtyřem písmenům Offset-O. Výstup je odpovídající lokalizovaný posun textu, pokud je posun nula. Výstup ve formě pěti znaků zobrazuje hodinu, minutu a volitelně sekundu, pokud není nulová, s dvojtečkou jako oddělovačem. Výstupem je "Z", pokud je posun nula. Šest nebo více písmen selže.
Volitelný začátek a konec oddílu: Použijte [] k definování volitelného oddílu, který může být i vnořený. Při formátování jsou všechna platná data výstupem, i když jsou v volitelné části. Během analýzy může v analyzovaném řetězci chybět celý oddíl. Volitelný oddíl je zahájen [ a ukončen pomocí ] (nebo na konci šablony).
Symboly "E", "F", "q" a "Q" lze použít pouze pro formátování data a času, například date_format. Nejsou povoleny pro parsování data a času, např. to_timestamp.

Váš názor

Byla tato stránka užitečná?

Last updated on 2026-06-29

Vzory pro datum a čas

Vzorová tabulka

Související články

Váš názor

Další materiály