Feriados

Dados de feriados mundiais originados do pacote de feriados PyPI e da Wikipédia, cobrindo 38 países ou regiões de 1970 a 2099.

Cada linha indica as informações de feriado para uma região, país ou data específica e se a maioria das pessoas tem folga remunerada.

Observação

A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.

Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.

Volume e retenção

Este conjunto de dados está armazenado no formato Parquet. É um instantâneo com informações de feriados desde 1º de janeiro de 1970 a 1º de janeiro de 2099. O tamanho dos dados é de cerca de 500 KB.

Local de armazenamento

Este conjunto de dados está armazenado na região Leste dos EUA do Azure. Recomenda-se alocar recursos de computação no Leste dos EUA para afinidade.

Informações adicionais

Este conjunto de dados combina dados originados da Wikipédia (WikiMedia Foundation Inc) e do pacote de feriados PyPI.

O conjunto de dados combinado é fornecido nos termos da Creative Commons Attribution-ShareAlike 3.0 Unported License.

Envie um email para aod@microsoft.com em caso de dúvidas sobre a fonte de dados.

Colunas

Nome Tipo de dados Exclusivo Valores (exemplo) Descrição
countryOrRegion string 38 Suécia Noruega Nome completo do país ou da região.
countryRegionCode string 35 ES NO Código do país ou da região seguindo o formato descrito aqui.
date timestamp 20,665 01-01-2074 00:00:00 25-12-2025 00:00:00 Data do feriado.
holidayName string 483 Søndag Söndag Nome completo do feriado.
isPaidTimeOff booleano 3 True Indica se a maioria das pessoas teve ausência remunerada nessa data (no momento, disponível apenas para EUA, GB e Índia). Se for NULL, significará desconhecido.
normalizeHolidayName string 438 Søndag Söndag Nome normalizado do feriado.

Versão Prévia

countryOrRegion holidayName normalizeHolidayName countryRegionCode date
Noruega Søndag Søndag Não 28/12/2098 00:00:00
Suécia Söndag Söndag SE 28/12/2098 00:00:00
Austrália Boxing Day Boxing Day AU 26/12/2098 00:00:00
Hungria Karácsony másnapja Karácsony másnapja HU 26/12/2098 00:00:00
Áustria Stefanitag Stefanitag AT 26/12/2098 00:00:00
Canadá Boxing Day Boxing Day CA 26/12/2098 00:00:00
Croácia Sveti Stjepan Sveti Stjepan HR 26/12/2098 00:00:00
Tcheco 2. svátek vánoční 2. svátek vánoční CZ 26/12/2098 00:00:00

Acesso de dados

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import PublicHolidays

from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta


end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))

Próximas etapas

Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.