NycTlcGreen 類別
代表 NYC 計程車 & Limousine Commission 綠色計程車車程公用數據集。
綠色計程車車程記錄包括各種欄位:用以擷取上車和下車日期/時間、上車和下車地點、車程距離、列舉車資、費率類型、付款類型和司機回報的乘客數。 如需此數據集的詳細資訊,包括數據行描述、存取數據集的不同方式,以及範例,請參閱 NYC 計程車 & Limousine Commission - Microsoft Azure 開放數據集目錄中的綠色計程車車程記錄。
如需使用 NycTlcGreen 類別的範例,請參閱 教學課程使用自動化機器學習來預測計程車車資。
初始化篩選欄位。
- 繼承
-
azureml.opendatasets._nyc_taxi_base.NycTaxiBaseNycTlcGreen
建構函式
NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 10, 18, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
參數
名稱 | Description |
---|---|
start_date
|
開始載入資料的日期,包含。 如果為 None,則會 預設值: 2015-01-01 00:00:00
|
end_date
|
結束載入資料的日期,包含。 如果為 None,則會 預設值: 2024-10-18 00:00:00
|
cols
|
要從數據集載入的數據列名稱清單。 如果為 None,則會載入所有數據行。 如需此數據集中可用數據行的資訊,請參閱 NYC Taxi & Limousine Commission - 綠色計程車車程記錄。 預設值: None
|
limit
|
值,表示使用 載入 預設值: -1
|
enable_telemetry
|
是否要在此數據集上啟用遙測。 預設值: True
|
start_date
必要
|
您想要以包容性方式查詢的開始日期。 |
end_date
必要
|
您想要以包容性方式查詢的結束日期。 |
cols
必要
|
您想要擷取的數據行名稱清單。 無會取得所有數據行。 |
limit
必要
|
to_pandas_dataframe () 只會載入「限制」的數據月份。 -1 表示沒有限制。 |
enable_telemetry
必要
|
指出是否要傳送遙測。 |
備註
下列範例示範如何存取數據集。
from azureml.opendatasets import NycTlcGreen
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()