Jours fériés

Données sur les jours fériés dans le monde provenant du package de jours fériés PyPI et de Wikipédia, couvrant 38 pays ou régions de 1970 à 2099.

Chaque ligne indique les informations de jours fériés pour une date et un pays ou une région spécifiques, et indique si la plupart des gens ont des congés payés.

Notes

Microsoft fournit Azure Open Datasets « en l’état ». Microsoft n’offre aucune garantie, expresse ou implicite, ni de conditions relatives à votre utilisation des jeux de données. Dans la mesure autorisée par votre droit local, Microsoft décline toute responsabilité pour les dommages ou pertes, y compris directs, consécutifs, spéciaux, indirects ou punitifs, résultant de votre utilisation des jeux de données.

Ce jeu de données est fourni selon les conditions initiales par lesquelles Microsoft a reçu les données sources. Le jeu de données peut inclure des données provenant de Microsoft.

Volume et conservation

Ce jeu de données est stocké au format Parquet. Il s’agit d’une capture instantanée des informations relatives aux jours fériés du 1er janvier 1970 au 1er janvier 2099. La taille des données est d’environ 500 Ko.

Emplacement de stockage

Ce jeu de données est stocké dans la région Azure USA Est. Nous vous recommandons de placer les ressources de calcul dans la région USA Est à des fins d’affinité.

Informations supplémentaires

Ce jeu de données combine des données provenant de Wikipédia (WikiMedia Foundation Inc) et du package PyPI Holidays.

Le jeu de données combiné est fourni sous la licence Creative Commons Attribution-ShareAlike 3.0 Unported.

Envoyez un e-mail à aod@microsoft.com si vous avez des questions sur la source de données.

Colonnes

Nom Type de données Unique Valeurs (exemple) Description
countryOrRegion string 38 Suède Norvège Nom complet du pays ou de la région.
countryRegionCode string 35 SE NON Code de pays ou région suivant le format indiqué ici.
Date timestamp 20 665 2074-01-01 00:00:00 2025-12-25 00:00:00 Date du jour férié.
holidayName string 483 Søndag Söndag Nom complet du jour férié.
isPaidTimeOff boolean 3 True Indique si la plupart des gens ont des congés payés à cette date (disponible uniquement pour les États-Unis, le Royaume-Uni et l’Inde). En cas de valeur NULL, cela signifie que cette information est inconnue.
normalizeHolidayName string 438 Søndag Söndag Nom normalisé du jour férié.

Préversion

countryOrRegion holidayName normalizeHolidayName countryRegionCode Date
Norvège Søndag Søndag Non 28/12/2098 00:00:00
Suède Söndag Söndag SE 28/12/2098 00:00:00
Australie Boxing Day Boxing Day AU 26/12/2098 00:00:00
Hongrie Karácsony másnapja Karácsony másnapja HU 26/12/2098 00:00:00
Autriche Stefanitag Stefanitag AT 26/12/2098 00:00:00
Canada Boxing Day Boxing Day CA 26/12/2098 00:00:00
Croatie Sveti Stjepan Sveti Stjepan HR 26/12/2098 00:00:00
Tchèque 2. svátek vánoční 2. svátek vánoční CZ 26/12/2098 00:00:00

Accès aux données

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))

Étapes suivantes

Consultez les autres jeux de données du catalogue Open Datasets.