Share via


ForecastingPipelineWrapperBase 클래스

예측 모델 래퍼의 기본 클래스입니다.

상속
ForecastingPipelineWrapperBase

생성자

ForecastingPipelineWrapperBase(ts_transformer: TimeSeriesTransformer | None = None, y_transformer: Pipeline | None = None, metadata: Dict[str, Any] | None = None)

매개 변수

ts_transformer
기본값: None
y_transformer
기본값: None
metadata
기본값: None

메서드

align_output_to_input

변환된 출력 데이터 프레임을 입력 데이터 프레임에 정렬합니다.

참고: 변환된 항목은 참조로 수정되며 사본이 만들어지지 않습니다. :param X_input: 입력 데이터 프레임입니다. :param transformed: 변환 후의 데이터 프레임입니다. :returns: 원래 인덱스로 변환된 데이터 프레임이지만 X_input과 같은 방법으로 정렬됩니다.

fit

입력 X 및 y를 사용하여 모델에 맞습니다.

forecast

데이터 프레임 X_pred에서 예측을 수행합니다.

forecast_quantiles

맞춤 파이프라인에서 예측 및 분위수를 가져옵니다.

is_grain_dropped

시간 조직이 삭제되는 경우 true를 반환합니다.

preaggregate_data_set

예측 데이터 세트를 집계합니다.

참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다.

preprocess_pred_X_y

예측 X 및 y를 전처리합니다.

rolling_evaluation

" 지정된 테스트 세트를 통해 롤링 원본에 대한 예측을 생성합니다.

각 반복은 현재 원점과 관련하여 다음 'max_horizon' 기간에 대한 예측을 수행한 다음, 수평선 기간까지 원본을 진행합니다. 예측자가 지연 기능을 생성하기 위해 현재 원본 시간 이전의 실제 대상 값을 사용하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다.

이 함수는 테스트 세트의 실제와 결합된 롤링 예측의 조인된 DataFrame을 반환합니다.

이 메서드는 더 이상 사용되지 않으며 향후 릴리스에서 제거될 예정입니다. 대신 rolling_forecast()를 사용하세요.

rolling_forecast

테스트 집합을 통해 롤링 원본에 대한 예측을 생성합니다.

각 반복은 현재 원본까지의 정보를 사용하여 앞으로 최대 수평 기간을 예측한 다음, '단계' 기간별로 원본을 진행합니다. 예측이 현재 원본 시간 이전의 실제 대상 값을 사용하여 조회 기능을 생성하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다.

이 함수는 테스트 집합의 실제 항목과 조인된 롤링 예측의 DataFrame을 반환합니다. 반환된 데이터 프레임의 열은 다음과 같습니다.

  • Timeseries ID 열(선택 사항). 사용자가 제공하는 경우 지정된 열 이름이 사용됩니다.

  • 각 행에 대한 원본 시간을 제공하는 원본 열을 예측합니다.

    열 이름: forecast_origin_column_name 개체 멤버 변수로 저장됩니다.

  • 시간 열입니다. 사용자가 지정한 열 이름이 사용됩니다.

  • 예측 값 열입니다. 열 이름: 개체 멤버 forecast_column_name

  • 실제 값 열입니다. 열 이름: 개체 멤버로 저장 actual_column_name

short_grain_handling

모델에 대해 시간 조직 처리가 짧거나 없는 경우 true를 반환합니다.

static_preaggregate_data_set

예측 데이터 세트를 집계합니다.

참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param ts_transformer: 학습에 사용되는 시계열 변환기입니다. :param time_column_name: 시간 열의 이름입니다. :param grain_column_names: 시간 조직 열 이름 목록입니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다.

align_output_to_input

변환된 출력 데이터 프레임을 입력 데이터 프레임에 정렬합니다.

참고: 변환된 항목은 참조로 수정되며 사본이 만들어지지 않습니다. :param X_input: 입력 데이터 프레임입니다. :param transformed: 변환 후의 데이터 프레임입니다. :returns: 원래 인덱스로 변환된 데이터 프레임이지만 X_input과 같은 방법으로 정렬됩니다.

align_output_to_input(X_input: DataFrame, transformed: DataFrame) -> DataFrame

매개 변수

X_input
필수
transformed
필수

fit

입력 X 및 y를 사용하여 모델에 맞습니다.

fit(X: DataFrame, y: ndarray) -> ForecastingPipelineWrapperBase

매개 변수

X
필수

입력 X 데이터입니다.

y
필수

y 데이터를 입력합니다.

forecast

데이터 프레임 X_pred에서 예측을 수행합니다.

forecast(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, forecast_destination: Timestamp | None = None, ignore_data_errors: bool = False) -> Tuple[ndarray, DataFrame]

매개 변수

X_pred
기본값: None

X_past 및 X_future를 시간 연속 방식으로 결합하는 예측 데이터 프레임입니다. X_pred의 빈 값은 대체됩니다.

y_pred
기본값: None

y_past의 확정 값과 Y_future의 누락 값을 결합한 대상 값입니다. None이면 모든 X_pred에 대해 예측이 이루어집니다.

forecast_destination
<xref:pandas.Timestamp>
기본값: None

Forecast_destination: 타임스탬프 값입니다. 모든 시간 조직에 대해 Forecast_destination 시간까지 예측이 이루어집니다. 사전 입력 { 시간 조직 -> 타임스탬프 }는 허용되지 않습니다. Forecast_destination이 제공되지 않으면 모든 시간 조직에 대해 X_pred에서 발생한 마지막 시간으로 간주됩니다.

ignore_data_errors
bool
기본값: False

사용자 데이터의 오류를 무시합니다.

반환

Y_pred, Y_future에 해당하는 하위 프레임이 각각의 예측으로 채워집니다. Y_past의 누락된 값은 imputer로 채워집니다.

반환 형식

forecast_quantiles

맞춤 파이프라인에서 예측 및 분위수를 가져옵니다.

forecast_quantiles(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, quantiles: float | List[float] | None = None, forecast_destination: Timestamp | None = None, ignore_data_errors: bool = False) -> DataFrame

매개 변수

X_pred
기본값: None

X_past 및 X_future를 시간 연속 방식으로 결합하는 예측 데이터 프레임입니다. X_pred의 빈 값은 대체됩니다.

y_pred
기본값: None

y_past의 확정 값과 Y_future의 누락 값을 결합한 대상 값입니다. None이면 모든 X_pred에 대해 예측이 이루어집니다.

quantiles
float 또는 list of <xref:floats>
기본값: None

예측하려는 분위수 목록입니다.

forecast_destination
<xref:pandas.Timestamp>
기본값: None

Forecast_destination: 타임스탬프 값입니다. 모든 시간 조직에 대해 Forecast_destination 시간까지 예측이 이루어집니다. 사전 입력 { 시간 조직 -> 타임스탬프 }는 허용되지 않습니다. Forecast_destination이 제공되지 않으면 모든 시간 조직에 대해 X_pred에서 발생한 마지막 시간으로 간주됩니다.

ignore_data_errors
bool
기본값: False

사용자 데이터의 오류를 무시합니다.

반환

요청된 분위수에서 수행한 열 및 예측을 포함하는 데이터 프레임입니다.

is_grain_dropped

시간 조직이 삭제되는 경우 true를 반환합니다.

is_grain_dropped(grain: Tuple[str] | str | List[str]) -> bool

매개 변수

grain
필수

삭제될지 여부를 테스트하는 시간 조직입니다.

반환

시간 조직이 삭제되는 경우 true입니다.

preaggregate_data_set

예측 데이터 세트를 집계합니다.

참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다.

preaggregate_data_set(df: DataFrame, y: ndarray | None = None, is_training_set: bool = False) -> Tuple[DataFrame, ndarray | None]

매개 변수

df
필수
y
기본값: None
is_training_set
기본값: False

preprocess_pred_X_y

예측 X 및 y를 전처리합니다.

preprocess_pred_X_y(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, forecast_destination: Timestamp | None = None) -> Tuple[DataFrame, DataFrame | ndarray, Dict[str, Any]]

매개 변수

X_pred
기본값: None
y_pred
기본값: None
forecast_destination
기본값: None

rolling_evaluation

" 지정된 테스트 세트를 통해 롤링 원본에 대한 예측을 생성합니다.

각 반복은 현재 원점과 관련하여 다음 'max_horizon' 기간에 대한 예측을 수행한 다음, 수평선 기간까지 원본을 진행합니다. 예측자가 지연 기능을 생성하기 위해 현재 원본 시간 이전의 실제 대상 값을 사용하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다.

이 함수는 테스트 세트의 실제와 결합된 롤링 예측의 조인된 DataFrame을 반환합니다.

이 메서드는 더 이상 사용되지 않으며 향후 릴리스에서 제거될 예정입니다. 대신 rolling_forecast()를 사용하세요.

rolling_evaluation(X_pred: DataFrame, y_pred: DataFrame | ndarray, ignore_data_errors: bool = False) -> Tuple[ndarray, DataFrame]

매개 변수

X_pred
필수

X_past 및 X_future를 시간 연속 방식으로 결합하는 예측 데이터 프레임입니다. X_pred의 빈 값은 대체됩니다.

y_pred
필수

X_pred에 해당하는 대상 값입니다.

ignore_data_errors
기본값: False

사용자 데이터의 오류를 무시합니다.

반환

Y_pred, Y_future에 해당하는 하위 프레임이 각각의 예측으로 채워집니다. Y_past의 누락된 값은 imputer로 채워집니다.

반환 형식

rolling_forecast

테스트 집합을 통해 롤링 원본에 대한 예측을 생성합니다.

각 반복은 현재 원본까지의 정보를 사용하여 앞으로 최대 수평 기간을 예측한 다음, '단계' 기간별로 원본을 진행합니다. 예측이 현재 원본 시간 이전의 실제 대상 값을 사용하여 조회 기능을 생성하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다.

이 함수는 테스트 집합의 실제 항목과 조인된 롤링 예측의 DataFrame을 반환합니다. 반환된 데이터 프레임의 열은 다음과 같습니다.

  • Timeseries ID 열(선택 사항). 사용자가 제공하는 경우 지정된 열 이름이 사용됩니다.

  • 각 행에 대한 원본 시간을 제공하는 원본 열을 예측합니다.

    열 이름: forecast_origin_column_name 개체 멤버 변수로 저장됩니다.

  • 시간 열입니다. 사용자가 지정한 열 이름이 사용됩니다.

  • 예측 값 열입니다. 열 이름: 개체 멤버 forecast_column_name

  • 실제 값 열입니다. 열 이름: 개체 멤버로 저장 actual_column_name

rolling_forecast(X_pred: DataFrame, y_pred: ndarray, step: int = 1, ignore_data_errors: bool = False) -> DataFrame

매개 변수

X_pred
<xref:pd.DataFrame>
필수

예측 데이터 프레임

y_pred
<xref:np.ndarray>
필수

X_pred 행에 해당하는 대상 값

step
int
기본값: 1

각 반복에서 예측 기간을 진행하는 기간 수입니다.

ignore_data_errors
bool
기본값: False

사용자 데이터의 오류를 무시합니다.

반환

롤링 예측의 데이터 프레임

반환 형식

<xref:pd.DataFrame>

short_grain_handling

모델에 대해 시간 조직 처리가 짧거나 없는 경우 true를 반환합니다.

short_grain_handling() -> bool

static_preaggregate_data_set

예측 데이터 세트를 집계합니다.

참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param ts_transformer: 학습에 사용되는 시계열 변환기입니다. :param time_column_name: 시간 열의 이름입니다. :param grain_column_names: 시간 조직 열 이름 목록입니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다.

static static_preaggregate_data_set(ts_transformer: TimeSeriesTransformer, time_column_name: str, grain_column_names: List[str], df: DataFrame, y: ndarray | None = None, is_training_set: bool = False) -> Tuple[DataFrame, ndarray | None]

매개 변수

ts_transformer
필수
time_column_name
필수
grain_column_names
필수
df
필수
y
기본값: None
is_training_set
기본값: False

특성

actual_column_name

forecast_column_name

forecast_origin_column_name

grain_column_list

max_horizon

모델에 사용된 최대 hiorizon을 반환합니다.

origin_col_name

원본 열 이름을 반환합니다.

target_lags

대상 지연을 반환합니다(있는 경우).

target_rolling_window_size

롤링 창의 크기를 반환합니다.

time_column_name

시간 열의 이름을 반환합니다.

user_target_column_name

y_max_dict

시계열 ID별 최대 대상 값이 있는 사전 반환

y_min_dict

시계열 ID별 최소 대상 값으로 사전 반환

FATAL_NO_TARGET_IMPUTER

FATAL_NO_TARGET_IMPUTER = 'No target imputers were found in TimeSeriesTransformer.'

FATAL_NO_TS_TRANSFORM

FATAL_NO_TS_TRANSFORM = 'The time series transform is absent. Please try training model again.'