Partilhar via


NycTlcGreen Classe

Representa o conjunto de dados público da viagem de táxi verde da NYC Taxi & Limousine Commission.

Os registros verdes de viagem de táxi incluem campos que capturam datas/horários de embarque e desembarque, locais de embarque e desembarque, distâncias da viagem, tarifas discriminadas, tipos de tarifa, tipos de pagamento e contagens de passageiros relatados pelo motorista. Para obter mais informações sobre esse conjunto de dados, incluindo descrições de coluna, diferentes maneiras de acessar o conjunto de dados e exemplos, consulte NYC Taxi & Limousine Commission - registros de viagem de táxi verde no catálogo de conjuntos de dados abertos do Microsoft Azure.

Para obter um exemplo de como usar a classe NycTlcGreen, consulte o tutorial Usar aprendizado de máquina automatizado para prever tarifas de táxi.

Inicializar campos de filtragem.

Construtor

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parâmetros

Name Description
start_date

A data em que deve começar a carregar dados, inclusive. Se Nenhum, o default_start_date é usado.

Default value: 2015-01-01 00:00:00
end_date

A data em que os dados devem ser terminados, inclusive. Se Nenhum, o default_end_date é usado.

Default value: 2024-12-13 00:00:00
cols

Uma lista de nomes de colunas a serem carregados do conjunto de dados. Se Nenhuma, todas as colunas serão carregadas. Para obter informações sobre as colunas disponíveis neste conjunto de dados, consulte NYC Taxi & Limousine Commission - green taxi trip records.

Default value: None
limit
int

Um valor que indica o número de dias de dados a serem carregados com to_pandas_dataframe()o . Se não for especificado, o padrão de -1 significa que não há limite de dias carregados.

Default value: -1
enable_telemetry

Se a telemetria deve ser habilitada nesse conjunto de dados.

Default value: True
start_date
Necessário

A data de início que você gostaria de consultar inclusive.

end_date
Necessário

A data de término que você gostaria de consultar, inclusive.

cols
Necessário

Uma lista de nomes de colunas que você gostaria de recuperar. Nenhum receberá todas as colunas.

limit
Necessário
int

to_pandas_dataframe() carregará apenas "limites" meses de dados. -1 significa sem limite.

enable_telemetry
Necessário

Indica se a telemetria deve ser enviada.

Observações

O exemplo abaixo mostra como acessar o conjunto de dados.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()