Święta

Dane dotyczące świąt na całym świecie pobrane z pakietu PyPI holidays oraz witryny Wikipedia, obejmujące 38 krajów i regionów w latach 1970–2099.

Każdy wiersz wskazuje informacje na temat świąt dotyczące konkretnej daty, kraju lub regionu i tego, czy większość osób ma wówczas płatny dzień wolny.

Uwaga

Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych ani domniemanych, gwarancji ani warunków dotyczących korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wynikowe, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.

Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.

Ilość i przechowywanie

Ten zestaw danych jest przechowywany w formacie Parquet. Jest to migawka z informacjami świątecznymi od 1 stycznia 1970 r. do 1 stycznia 2099 r. Rozmiar danych to około 500 KB.

Lokalizacja magazynu

Ten zestaw danych jest przechowywany w regionie platformy Azure Wschodnie stany USA. Zalecamy lokalizowanie zasobów obliczeniowych w regionie Wschodnie stany USA w celu koligacji.

Dodatkowe informacje

Ten zestaw danych łączy dane pochodzące z Wikipedii (WikiMedia Foundation Inc) i pakietu wakacji PyPI.

Ten połączony zestaw danych jest udostępniany w ramach licencji Creative Commons Attribution-ShareAlike 3.0 Unported License.

Jeśli masz pytania dotyczące tego zestawu danych, napisz wiadomość e-mail na adres aod@microsoft.com.

Kolumny

Nazwa Typ danych Unikatowe Wartości (przykład) Opis
countryOrRegion ciąg 38 Szwecja Norwegia Pełna nazwa kraju lub regionu.
countryRegionCode ciąg 35 SE NIE Kod kraju lub regionu zgodny z formatem podanym tutaj.
data sygnatura czasowa 20,665 2074-01-01 00:00:00 2025-12-25 00:00:00 Data święta.
holidayName ciąg 483 Søndag Söndag Pełna nazwa święta.
isPaidTimeOff boolean 3 Prawda Wskazuje, czy większość osób zapłaciła czas wolny od tej daty (teraz jest dostępna tylko dla Stanów Zjednoczonych, GB i Indii). Wartość NULL oznacza „nie wiadomo”.
normalizeHolidayName ciąg 438 Søndag Söndag Znormalizowana nazwa święta.

Wersja zapoznawcza

countryOrRegion holidayName normalizeHolidayName countryRegionCode data
Norwegia Søndag Søndag NO 12/28/2098 12:00:00
Szwecja Söndag Söndag SE 12/28/2098 12:00:00
Australia Dzień Boksu Dzień Boksu AU 12/26/2098 12:00:00
Węgry Karácsony másnapja Karácsony másnapja HU 12/26/2098 12:00:00
Austria Stefanitag Stefanitag AT 12/26/2098 12:00:00
Kanada Dzień Boksu Dzień Boksu CA 12/26/2098 12:00:00
Chorwacja Petersburg Stjepan Petersburg Stjepan HR 12/26/2098 12:00:00
Czeski 2. svátek vánoční 2. svátek vánoční CZ 12/26/2098 12:00:00

Dostęp do danych

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://docs.microsoft.com/en-us/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))

Następne kroki

Wyświetl resztę zestawów danych w katalogu Open Datasets (Otwarte zestawy danych).