다음을 통해 공유


NycTlcGreen 클래스

NYC Taxi & 리무진 위원회 녹색 택시 여행 공용 데이터 세트를 나타냅니다.

녹색 택시 이동 레코드에는 승차 및 하차 날짜/시간, 승차 및 하단 위치, 이동 거리, 항목별 요금, 요율 종류, 지불 유형 및 운전자가 보고한 승객 수를 캡처하는 필드가 포함됩니다. 열 설명, 데이터 세트에 액세스하는 다양한 방법 및 예제를 포함하여 이 데이터 세트에 대한 자세한 내용은 MICROSOFT Azure Open Datasets 카탈로그의 NYC Taxi & Limousine Commission - 녹색 택시 여정 레코드 를 참조하세요.

NycTlcGreen 클래스를 사용하는 예제는 자동화된 Machine Learning을 사용하여 택시 요금 예측 자습서를 참조하세요.

필터링 필드를 초기화합니다.

상속
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcGreen

생성자

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 10, 18, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

매개 변수

Name Description
start_date

데이터 로드를 시작할 날짜(포함)입니다. None이면 default_start_date가 사용됩니다.

Default value: 2015-01-01 00:00:00
end_date

데이터 로드를 종료할 날짜(포함)입니다. None이면 default_end_date가 사용됩니다.

Default value: 2024-10-18 00:00:00
cols

데이터 집합에서 로드할 열 이름 목록입니다. None이면 모든 열이 로드됩니다. 이 데이터 세트의 사용 가능한 열에 대한 자세한 내용은 NYC Taxi & Limousine Commission - 녹색 택시 여정 레코드를 참조하세요.

Default value: None
limit
int

to_pandas_dataframe()으로 로드할 데이터의 일 수를 나타내는 값입니다. 지정하지 않으면 기본값 -1은 로드된 날짜에 제한이 없음을 의미합니다.

Default value: -1
enable_telemetry

이 데이터 세트에서 원격 분석을 사용하도록 설정할지 여부를 나타냅니다.

Default value: True
start_date
필수

포괄적으로 쿼리하려는 시작 날짜입니다.

end_date
필수

포괄적으로 쿼리하려는 종료 날짜입니다.

cols
필수

검색하려는 열 이름 목록입니다. None은 모든 열을 가져옵니다.

limit
필수
int

to_pandas_dataframe()는 "제한" 개월의 데이터만 로드합니다. -1은 제한 없음을 의미합니다.

enable_telemetry
필수

원격 분석을 보낼지 여부를 나타냅니다.

설명

아래 예제는 데이터 세트에 액세스하는 방법을 보여 줍니다.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()