Święta

Dane dotyczące świąt na całym świecie pobrane z pakietu PyPI holidays oraz witryny Wikipedia, obejmujące 38 krajów i regionów w latach 1970–2099.

Każdy wiersz wskazuje informacje na temat świąt dotyczące konkretnej daty, kraju lub regionu i tego, czy większość osób ma wówczas płatny dzień wolny.

Uwaga

Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.

Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.

Wolumin i przechowywanie

Ten zestaw danych jest przechowywany w formacie Parquet. Jest to migawka z informacjami o wakacjach od 1 stycznia 1970 do 1 stycznia 2099 r. Rozmiar danych to około 500 KB.

Lokalizacja usługi Storage

Ten zestaw danych jest przechowywany w regionie platformy Azure Wschodnie stany USA. Zalecamy lokalizowanie zasobów obliczeniowych w regionie Wschodnie stany USA pod kątem koligacji.

Dodatkowe informacje

Ten zestaw danych łączy dane pobrane z witryny Wikipedia (WikiMedia Foundation Inc.) oraz pakietu PyPI holidays.

Ten połączony zestaw danych jest udostępniany w ramach licencji Creative Commons Attribution-ShareAlike 3.0 Unported License.

Jeśli masz pytania dotyczące tego zestawu danych, napisz wiadomość e-mail na adres aod@microsoft.com.

Kolumny

Nazwisko Typ danych Unikatowe Wartości (przykładowe) opis
countryOrRegion string 38 Szwecja Norwegia Pełna nazwa kraju lub regionu.
countryRegionCode string 35 SE NIE Kod kraju lub regionu zgodny z formatem podanym tutaj.
data timestamp 20,665 2074-01-01 00:00:00 2025-12-25 00:00:00 Data święta.
holidayName string 483 Søndag Söndag Pełna nazwa święta.
isPaidTimeOff boolean 3 Prawda Wskaż, czy większość osób zapłaciła czas wolny od tej daty (obecnie jest dostępna tylko dla STANÓW Zjednoczonych, GB i Indii). Wartość NULL oznacza „nie wiadomo”.
normalizeHolidayName string 438 Søndag Söndag Znormalizowana nazwa święta.

Wersja zapoznawcza

countryOrRegion holidayName normalizeHolidayName countryRegionCode data
Norwegia Søndag Søndag NIE 12/28/2098 12:00:00
Szwecja Söndag Söndag SE 12/28/2098 12:00:00
Australia Dzień Boksu Dzień Boksu AU 12/26/2098 12:00:00
Węgry Karácsony másnapja Karácsony másnapja HU 12/26/2098 12:00:00
Austria Stefanitag Stefanitag AT 12/26/2098 12:00:00
Kanada Dzień Boksu Dzień Boksu CA 12/26/2098 12:00:00
Chorwacja Grzegorz Stjepan Grzegorz Stjepan Zasoby ludzkie 12/26/2098 12:00:00
Czeski 2. svátek vánoční 2. svátek vánoční CZ 12/26/2098 12:00:00

Dostęp do danych

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))

Następne kroki

Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).