다음을 통해 공유


NycTlcFhv 클래스

NYC Taxi & Limousine Commission 공용 데이터 세트를 나타냅니다.

이 데이터 세트에는 배차 기준 라이선스 번호 및 픽업 날짜, 시간, 택시 승차 구역 위치 ID(아래의 도형 파일)를 캡처하는 필드를 포함하는 FHV(For-Hire Vehicle) 이동 레코드가 포함됩니다. 이러한 레코드는 기준에 따라 제출된 FHV 이동 레코드에서 생성됩니다. 열 설명, 데이터 세트에 액세스하는 다양한 방법 및 예제를 포함하여 이 데이터 세트에 대한 자세한 내용은 Microsoft Azure Open Datasets 카탈로그의 NYC Taxi & Limousine Commission - For-Hire Vehicle(FHV) 여정 레코드 를 참조하세요.

필터링 필드를 초기화합니다.

상속
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcFhv

생성자

NycTlcFhv(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 10, 18, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

매개 변수

Name Description
start_date

데이터 로드를 시작할 날짜(포함)입니다. None이면 default_start_date가 사용됩니다.

Default value: 2015-01-01 00:00:00
end_date

데이터 로드를 종료할 날짜(포함)입니다. None이면 default_end_date가 사용됩니다.

Default value: 2024-10-18 00:00:00
cols

데이터 집합에서 로드할 열 이름 목록입니다. None이면 모든 열이 로드됩니다. 이 데이터 세트의 사용 가능한 열에 대한 자세한 내용은 NYC Taxi & 리무진 위원회 - For-Hire 차량(FHV) 여정 레코드를 참조하세요.

Default value: None
limit
int

to_pandas_dataframe()으로 로드할 데이터의 일 수를 나타내는 값입니다. 지정하지 않으면 기본값 -1은 로드된 날짜에 제한이 없음을 의미합니다.

Default value: -1
enable_telemetry

이 데이터 세트에서 원격 분석을 사용하도록 설정할지 여부를 나타냅니다.

Default value: True
start_date
필수

포괄적으로 쿼리하려는 시작 날짜입니다.

end_date
필수

포괄적으로 쿼리하려는 종료 날짜입니다.

cols
필수

검색하려는 열 이름 목록입니다. None은 모든 열을 가져옵니다.

limit
필수
int

to_pandas_dataframe()는 "제한" 개월의 데이터만 로드합니다. -1은 제한 없음을 의미합니다.

enable_telemetry
필수

원격 분석을 보낼지 여부를 나타냅니다.

설명

아래 예제는 데이터 세트에 액세스하는 방법을 보여 줍니다.


   from azureml.opendatasets import NycTlcFhv
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()