Partager via


NycTlcYellow Classe

Représente le jeu de données public de la Commission nyC Taxi &Limousine Commission pour taxi jaune.

Les enregistrements de trajet de taxi jaune incluent les champs capturant les dates/heures de récupération et de dépôt, les emplacements de récupération et de dépôt, les distances de trajet, les tarifs détaillés, les types de tarifs, les types de paiement et les nombres de passagers signalés par les conducteurs. Pour plus d’informations sur ce jeu de données, notamment les descriptions de colonnes, différentes façons d’accéder au jeu de données et des exemples, consultez la Commission nyC Taxi &Limousine - enregistrements de trajet de taxi jaune dans le catalogue Microsoft Azure Open Datasets.

Initialisez les champs de filtrage.

Constructeur

NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Paramètres

Nom Description
start_date

Date à laquelle commencer le chargement des données, inclus. Si aucun n’est utilisé, il default_start_date est utilisé.

Valeur par défaut: 2015-01-01 00:00:00
end_date

Date à laquelle terminer le chargement des données, inclus. Si aucun n’est utilisé, il default_end_date est utilisé.

Valeur par défaut: 2024-12-13 00:00:00
cols

Liste des noms de colonnes à charger à partir du jeu de données. Si aucune, toutes les colonnes sont chargées. Pour plus d’informations sur les colonnes disponibles dans ce jeu de données, consultez nyC Taxi &Limousine Commission - Enregistrements de trajet de taxi jaune.

Valeur par défaut: None
limit
int

Valeur indiquant le nombre de jours de chargement des données avec to_pandas_dataframe(). S’il n’est pas spécifié, la valeur par défaut de -1 signifie qu’aucune limite n’est définie sur les jours chargés.

Valeur par défaut: -1
enable_telemetry

Indique s’il faut activer la télémétrie sur ce jeu de données.

Valeur par défaut: True
start_date
Obligatoire

Date de début que vous souhaitez interroger inclusivement.

end_date
Obligatoire

Date de fin à laquelle vous souhaitez effectuer une requête inclusive.

cols
Obligatoire

Liste des noms de colonnes que vous souhaitez récupérer. Aucun n’obtient toutes les colonnes.

limit
Obligatoire
int

to_pandas_dataframe() charge uniquement les mois de données « limite ». -1 signifie aucune limite.

enable_telemetry
Obligatoire

Indique s’il faut envoyer des données de télémétrie.

Remarques

L’exemple ci-dessous montre comment accéder au jeu de données.


   from azureml.opendatasets import NycTlcYellow
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()