Sdílet prostřednictvím


NycTlcYellow Třída

Představuje veřejnou datovou sadu pro jízdu žlutým taxíkem NYC Taxi & Limuzíny.

Záznamy o cestách žlutým taxíkem obsahují pole zachytávající data a časy vyzvednutí a vysazení, místa vyzvednutí a vysazení, ujeté vzdálenosti, jízdné rozdělené na položky, typy sazeb, typy plateb a počty cestujících nahlášené řidičem. Další informace o této datové sadě, včetně popisů sloupců, různých způsobů přístupu k datové sadě a příkladů, najdete v tématu Komise pro newyorské taxislužby & Limuzíny – záznamy o žlutých jízdách taxíkem v katalogu Microsoft Azure Open Datasets.

Inicializace polí filtrování

Dědičnost
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcYellow

Konstruktor

NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 8, 15, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parametry

Name Description
start_date

Datum, od kterého se mají začít načítat data (včetně). Pokud žádné, použije se default_start_date hodnota .

Default value: 2015-01-01 00:00:00
end_date

Datum, ke kterému se má načítání dat ukončit (včetně). Pokud žádné, použije se default_end_date hodnota .

Default value: 2024-08-15 00:00:00
cols

Seznam názvů sloupců, které se mají načíst z datové sady. Pokud žádné, načtou se všechny sloupce. Informace o dostupných sloupcích v této datové sadě najdete v tématu Newyorské taxislužby & Limuzíny – záznamy o žlutých jízdách taxíkem.

Default value: None
limit
int

Hodnota označující počet dnů dat, která se mají načíst pomocí to_pandas_dataframe(). Pokud není zadaný, výchozí hodnota -1 znamená, že počet načtených dnů není omezen.

Default value: -1
enable_telemetry

Jestli se má u této datové sady povolit telemetrie.

Default value: True
start_date
Vyžadováno

Počáteční datum, které chcete včetně dotazovat.

end_date
Vyžadováno

Koncové datum, na které se chcete dotazovat včetně.

cols
Vyžadováno

Seznam názvů sloupců, které chcete načíst. Možnost Žádná nebude mít všechny sloupce.

limit
Vyžadováno
int

to_pandas_dataframe() načte pouze data "limitovaných" měsíců. -1 znamená bez omezení.

enable_telemetry
Vyžadováno

Určuje, jestli se má odesílat telemetrie.

Poznámky

Následující příklad ukazuje, jak získat přístup k datové sadě.


   from azureml.opendatasets import NycTlcYellow
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()