Svátcích

Data o celosvětových svátcích pocházející z balíčku PyPI holidays a z Wikipedie, která pokrývají 38 zemí nebo oblastí od roku 1970 do roku 2099.

Každý řádek obsahuje informace o svátcích pro konkrétní datum a zemi nebo oblast a uvádí, jestli má během daného svátku většina lidí placené volno.

Poznámka:

Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.

Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.

Objem a uchovávání

Tato datová sada se uchovává ve formátu Parquet. Jedná se o snímek s informacemi o svátce od 1. ledna 1970 do 1. ledna 2099. Velikost dat je přibližně 500 kB.

Umístění úložiště

Tato datová sada se uchovává v oblasti Azure Východní USA. Pro spřažení doporučujeme vyhledat výpočetní prostředky v oblasti USA – východ.

Další informace

Tato datová sada kombinuje data pocházející z Wikipedie (WikiMedia Foundation Inc) a balíčku PyPI Holidays.

Tato kombinovaná datová sada se poskytuje v rámci licence Creative Commons Attribution-ShareAlike 3.0 Unported License.

Pokud ohledně tohoto zdroje dat máte jakékoli dotazy, zašlete e-mail na adresu aod@microsoft.com.

Sloupce

Name Datový typ Jedinečný Values (sample) Popis
countryOrRegion string 38 Švédsko Norsko Celý název země nebo oblasti
countryRegionCode string 35 SE NE Kód země nebo oblasti v tomto formátu
datum časové razítko 20,665 2074-01-01 00:00:00 2025-12-25 00:00:00 Datum svátku
holidayName string 483 Søndag Söndag Celý název svátku
isPaidTimeOff boolean 3 True Určete, jestli většina lidí v tomto datu zaplatila volno (k dispozici pouze pro USA, GB a Indii). Hodnota NULL znamená neznámý stav.
normalizeHolidayName string 438 Søndag Söndag Normalizovaný název svátku

Ukázková

countryOrRegion holidayName normalizeHolidayName countryRegionCode datum
Norsko Søndag Søndag NE 28.12.2098 12:00:00
Švédsko Söndag Söndag SE 28.12.2098 12:00:00
Austrálie Den boxingu Den boxingu AU 26. 12. 2098 12:00:00
Maďarsko Karácsony másnapja Karácsony másnapja HU 26. 12. 2098 12:00:00
Rakousko Stefanitag Stefanitag AT 26. 12. 2098 12:00:00
Kanada Den boxingu Den boxingu CA 26. 12. 2098 12:00:00
Chorvatsko Sveti Stjepan Sveti Stjepan HR 26. 12. 2098 12:00:00
Čeština 2. svátek vánoční 2. svátek vánoční CZ 26. 12. 2098 12:00:00

Přístup k datům

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))

Další kroky

Prohlédněte si zbývající datové sady v katalogu Open Datasets.