다음을 통해 공유


NoaaGfsWeather 클래스

NOAA(National Oceanic and Atmospheric Administration) GFS(글로벌 예측 시스템) 데이터 세트를 나타냅니다.

이 데이터 세트에는 NOAA(National Oceanic and Atmospheric Administration)의 GFS(글로벌 예측 시스템)에서 생성한 15일 미국 시간별 일기 예보 데이터(예: 기온, 강수량, 바람)가 포함되어 있습니다. 열 설명, 데이터 세트에 액세스하는 다양한 방법, 예를 포함하여 이 데이터 세트에 대한 정보는 Microsoft Azure Open Datasets 카탈로그의 NOAA 글로벌 예측 시스템을 참조하세요.

필터링 필드를 초기화합니다.

상속
NoaaGfsWeather

생성자

NoaaGfsWeather(start_date: datetime = datetime.datetime(2018, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2018, 1, 1, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

매개 변수

Name Description
start_date

데이터 로드를 시작할 날짜(포함)입니다. None이면 default_start_date가 사용됩니다.

기본값: 2018-01-01 00:00:00
end_date

데이터 로드를 종료할 날짜(포함)입니다. None이면 default_end_date가 사용됩니다.

기본값: 2018-01-01 00:00:00
cols

데이터 집합에서 로드할 열 이름 목록입니다. None이면 모든 열이 로드됩니다. 이 데이터 세트에서 사용 가능한 열에 대한 정보는 NOAA 글로벌 예측 시스템을 참조하세요.

기본값: None
limit
int

to_pandas_dataframe()으로 로드할 데이터의 일 수를 나타내는 값입니다. 지정하지 않으면 기본값 -1은 로드된 날짜에 제한이 없음을 의미합니다.

기본값: -1
enable_telemetry

이 데이터 세트에서 원격 분석을 사용하도록 설정할지 여부를 나타냅니다.

기본값: True
start_date
필수

포괄적으로 쿼리하려는 시작 날짜입니다.

end_date
필수

포괄적으로 쿼리하려는 종료 날짜입니다.

cols
필수

검색하려는 열 이름 목록입니다. None은 모든 열을 가져옵니다.

limit
필수
int

to_pandas_dataframe()는 데이터의 "제한" 일만 로드합니다. -1은 제한 없음을 의미합니다.

enable_telemetry
필수

원격 분석을 보낼지 여부를 나타냅니다.

설명

아래 예는 데이터 세트 액세스를 사용하는 방법을 보여 줍니다.


   from azureml.opendatasets import NoaaGfsWeather
   from datetime import datetime
   from dateutil.relativedelta import relativedelta


   end_date = datetime.today()
   start_date = datetime.today() - relativedelta(months=1)
   gfs = NoaaGfsWeather(start_date=start_date, end_date=end_date)
   gfs_df = gfs.to_pandas_dataframe()

메서드

filter

필터 시간입니다.

filter

필터 시간입니다.

filter(env: RuntimeEnv, min_date: datetime, max_date: datetime)

매개 변수

Name Description
env
필수
<xref:azureml.opendatasets.RuntimeEnv>

런타임 환경입니다.

min_date
필수

최소 날짜입니다.

max_date
필수

최대 날짜입니다.

반환

형식 Description

필터링된 데이터 프레임입니다.

특성

default_end_date

default_end_date = datetime.datetime(2024, 5, 1, 0, 0)

default_start_date

default_start_date = datetime.datetime(2018, 1, 1, 0, 0)

id_column_name

id_column_name = 'ID'

latitude_column_name

latitude_column_name = 'latitude'

longitude_column_name

longitude_column_name = 'longitude'