Partilhar via


NycTlcYellow Classe

Representa o conjunto de dados públicos amarelos da Comissão de Táxis & Limousine.

Os registos de corridas de "yellow taxi" incluem campos que registam as datas/horas de recolha e entrega, as localizações de recolha e entrega, as distâncias das corridas, tarifas discriminadas, tipos de taxas, tipos de pagamentos e contagens de passageiros feitas pelo motorista. Para obter mais informações sobre este conjunto de dados, incluindo descrições de colunas, diferentes formas de aceder ao conjunto de dados e exemplos, veja Nyc Taxi & Limousine Commission - yellow taxi trip records in the Microsoft Azure Open Datasets catalog .

Inicializar campos de filtragem.

Herança
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcYellow

Construtor

NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 5, 1, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parâmetros

Name Description
start_date

A data em que começar a carregar dados, inclusive. Se Nenhum, o default_start_date é utilizado.

valor predefinido: 2015-01-01 00:00:00
end_date

A data em que terminar o carregamento de dados, inclusive. Se Nenhum, o default_end_date é utilizado.

valor predefinido: 2024-05-01 00:00:00
cols

Uma lista de nomes de colunas a carregar a partir do conjunto de dados. Se Nenhuma, todas as colunas são carregadas. Para obter informações sobre as colunas disponíveis neste conjunto de dados, veja NYC Taxi & Limousine Commission - yellow taxi trip records (Nyc Taxi & Limousine Commission - yellow taxi trip records).

valor predefinido: None
limit
int

Um valor que indica o número de dias de dados a carregar com to_pandas_dataframe(). Se não for especificado, a predefinição de -1 significa que não há limite para os dias carregados.

valor predefinido: -1
enable_telemetry

Se pretende ativar a telemetria neste conjunto de dados.

valor predefinido: True
start_date
Necessário

A data de início que pretende consultar de forma inclusiva.

end_date
Necessário

A data de fim que pretende consultar de forma inclusiva.

cols
Necessário

Uma lista de nomes de colunas que pretende obter. Nenhuma obterá todas as colunas.

limit
Necessário
int

to_pandas_dataframe() carregará apenas meses de "limite" de dados. -1 significa que não há limite.

enable_telemetry
Necessário

Indica se deve enviar telemetria.

Observações

O exemplo abaixo mostra como aceder ao conjunto de dados.


   from azureml.opendatasets import NycTlcYellow
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()