Delen via


NycTlcYellow Klas

Vertegenwoordigt de openbare gegevensset nyc taxi & Limousine Commission gele taxirit.

De gele taxiritrecords bevatten velden met de datums/tijden waarop passagiers zijn opgehaald en afgezet, locaties voor ophalen en afzetten, ritafstanden, in items verdeelde tarieven, tarieftypen, betalingstypen en door de chauffeur gerapporteerde passagiersaantallen. Zie NYC Taxi & Limousine Commission - gele taxiritrecords in de Microsoft Azure Open Datasets-catalogus voor meer informatie over deze gegevensset, waaronder kolombeschrijvingen, verschillende manieren om toegang te krijgen tot de gegevensset en voorbeelden.

Filtervelden initialiseren.

Overname
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcYellow

Constructor

NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 10, 18, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parameters

Name Description
start_date

De datum waarop u begint met het laden van gegevens, inclusief. Indien Geen, wordt de default_start_date gebruikt.

Default value: 2015-01-01 00:00:00
end_date

De datum waarop het laden van gegevens wordt beƫindigd, inclusief. Indien Geen, wordt de default_end_date gebruikt.

Default value: 2024-10-18 00:00:00
cols

Een lijst met kolomnamen die uit de gegevensset moeten worden geladen. Bij Geen worden alle kolommen geladen. Zie NYC Taxi & Limousine Commission - records voor gele taxirit voor informatie over de beschikbare kolommen in deze gegevensset.

Default value: None
limit
int

Een waarde die het aantal dagen aangeeft dat met gegevens moet worden geladen to_pandas_dataframe(). Indien niet opgegeven, betekent de standaardwaarde van -1 geen limiet voor het aantal dagen dat wordt geladen.

Default value: -1
enable_telemetry

Of telemetrie voor deze gegevensset moet worden ingeschakeld.

Default value: True
start_date
Vereist

De begindatum die u inclusief wilt opvragen.

end_date
Vereist

De einddatum die u inclusief wilt opvragen.

cols
Vereist

Een lijst met kolomnamen die u wilt ophalen. Geen krijgt alle kolommen.

limit
Vereist
int

to_pandas_dataframe() laadt alleen maanden aan gegevens. -1 betekent geen limiet.

enable_telemetry
Vereist

Hiermee wordt aangegeven of telemetrie moet worden verzonden.

Opmerkingen

In het onderstaande voorbeeld ziet u hoe u toegang hebt tot de gegevensset.


   from azureml.opendatasets import NycTlcYellow
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()