ForecastingPipelineWrapperBase 클래스

참조

예측 모델 래퍼의 기본 클래스입니다.

상속: ABC

ForecastingPipelineWrapperBase

생성자

ForecastingPipelineWrapperBase(ts_transformer: TimeSeriesTransformer | None = None, y_transformer: Pipeline | None = None, metadata: Dict[str, Any] | None = None)

매개 변수

ts_transformer

기본값: None

y_transformer

기본값: None

metadata

기본값: None

메서드

align_output_to_input	변환된 출력 데이터 프레임을 입력 데이터 프레임에 정렬합니다. 참고: 변환된 항목은 참조로 수정되며 사본이 만들어지지 않습니다. :param X_input: 입력 데이터 프레임입니다. :param transformed: 변환 후의 데이터 프레임입니다. :returns: 원래 인덱스로 변환된 데이터 프레임이지만 X_input과 같은 방법으로 정렬됩니다.
fit	입력 X 및 y를 사용하여 모델에 맞습니다.
forecast	데이터 프레임 X_pred에서 예측을 수행합니다.
forecast_quantiles	맞춤 파이프라인에서 예측 및 분위수를 가져옵니다.
is_grain_dropped	시간 조직이 삭제되는 경우 true를 반환합니다.
preaggregate_data_set	예측 데이터 세트를 집계합니다. 참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다.
preprocess_pred_X_y	예측 X 및 y를 전처리합니다.
rolling_evaluation	" 지정된 테스트 세트를 통해 롤링 원본에 대한 예측을 생성합니다. 각 반복은 현재 원점과 관련하여 다음 'max_horizon' 기간에 대한 예측을 수행한 다음, 수평선 기간까지 원본을 진행합니다. 예측자가 지연 기능을 생성하기 위해 현재 원본 시간 이전의 실제 대상 값을 사용하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다. 이 함수는 테스트 세트의 실제와 결합된 롤링 예측의 조인된 DataFrame을 반환합니다. 이 메서드는 더 이상 사용되지 않으며 향후 릴리스에서 제거될 예정입니다. 대신 rolling_forecast()를 사용하세요.
rolling_forecast	테스트 집합을 통해 롤링 원본에 대한 예측을 생성합니다. 각 반복은 현재 원본까지의 정보를 사용하여 앞으로 최대 수평 기간을 예측한 다음, '단계' 기간별로 원본을 진행합니다. 예측이 현재 원본 시간 이전의 실제 대상 값을 사용하여 조회 기능을 생성하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다. 이 함수는 테스트 집합의 실제 항목과 조인된 롤링 예측의 DataFrame을 반환합니다. 반환된 데이터 프레임의 열은 다음과 같습니다. Timeseries ID 열(선택 사항). 사용자가 제공하는 경우 지정된 열 이름이 사용됩니다. 각 행에 대한 원본 시간을 제공하는 원본 열을 예측합니다. 열 이름: forecast_origin_column_name 개체 멤버 변수로 저장됩니다. 시간 열입니다. 사용자가 지정한 열 이름이 사용됩니다. 예측 값 열입니다. 열 이름: 개체 멤버 forecast_column_name 실제 값 열입니다. 열 이름: 개체 멤버로 저장 actual_column_name
short_grain_handling	모델에 대해 시간 조직 처리가 짧거나 없는 경우 true를 반환합니다.
static_preaggregate_data_set	예측 데이터 세트를 집계합니다. 참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param ts_transformer: 학습에 사용되는 시계열 변환기입니다. :param time_column_name: 시간 열의 이름입니다. :param grain_column_names: 시간 조직 열 이름 목록입니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다.

align_output_to_input

변환된 출력 데이터 프레임을 입력 데이터 프레임에 정렬합니다.

참고: 변환된 항목은 참조로 수정되며 사본이 만들어지지 않습니다. :param X_input: 입력 데이터 프레임입니다. :param transformed: 변환 후의 데이터 프레임입니다. :returns: 원래 인덱스로 변환된 데이터 프레임이지만 X_input과 같은 방법으로 정렬됩니다.

align_output_to_input(X_input: DataFrame, transformed: DataFrame) -> DataFrame

매개 변수

X_input

필수

transformed

필수

fit

입력 X 및 y를 사용하여 모델에 맞습니다.

fit(X: DataFrame, y: ndarray) -> ForecastingPipelineWrapperBase

매개 변수

X

필수

입력 X 데이터입니다.

y

필수

y 데이터를 입력합니다.

forecast

데이터 프레임 X_pred에서 예측을 수행합니다.

forecast(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, forecast_destination: Timestamp | None = None, ignore_data_errors: bool = False) -> Tuple[ndarray, DataFrame]

매개 변수

X_pred

기본값: None

X_past 및 X_future를 시간 연속 방식으로 결합하는 예측 데이터 프레임입니다. X_pred의 빈 값은 대체됩니다.

y_pred

기본값: None

y_past의 확정 값과 Y_future의 누락 값을 결합한 대상 값입니다. None이면 모든 X_pred에 대해 예측이 이루어집니다.

forecast_destination: <xref:pandas.Timestamp>

기본값: None

Forecast_destination: 타임스탬프 값입니다. 모든 시간 조직에 대해 Forecast_destination 시간까지 예측이 이루어집니다. 사전 입력 { 시간 조직 -> 타임스탬프 }는 허용되지 않습니다. Forecast_destination이 제공되지 않으면 모든 시간 조직에 대해 X_pred에서 발생한 마지막 시간으로 간주됩니다.

ignore_data_errors: bool

기본값: False

사용자 데이터의 오류를 무시합니다.

반환

Y_pred, Y_future에 해당하는 하위 프레임이 각각의 예측으로 채워집니다. Y_past의 누락된 값은 imputer로 채워집니다.

반환 형식

tuple

forecast_quantiles

맞춤 파이프라인에서 예측 및 분위수를 가져옵니다.

forecast_quantiles(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, quantiles: float | List[float] | None = None, forecast_destination: Timestamp | None = None, ignore_data_errors: bool = False) -> DataFrame

매개 변수

X_pred

기본값: None

X_past 및 X_future를 시간 연속 방식으로 결합하는 예측 데이터 프레임입니다. X_pred의 빈 값은 대체됩니다.

y_pred

기본값: None

y_past의 확정 값과 Y_future의 누락 값을 결합한 대상 값입니다. None이면 모든 X_pred에 대해 예측이 이루어집니다.

quantiles: float 또는 list of <xref:floats>

기본값: None

예측하려는 분위수 목록입니다.

forecast_destination: <xref:pandas.Timestamp>

기본값: None

ignore_data_errors: bool

기본값: False

사용자 데이터의 오류를 무시합니다.

반환

요청된 분위수에서 수행한 열 및 예측을 포함하는 데이터 프레임입니다.

is_grain_dropped

시간 조직이 삭제되는 경우 true를 반환합니다.

is_grain_dropped(grain: Tuple[str] | str | List[str]) -> bool

매개 변수

grain

필수

삭제될지 여부를 테스트하는 시간 조직입니다.

반환

시간 조직이 삭제되는 경우 true입니다.

preaggregate_data_set

예측 데이터 세트를 집계합니다.

참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다.

preaggregate_data_set(df: DataFrame, y: ndarray | None = None, is_training_set: bool = False) -> Tuple[DataFrame, ndarray | None]

매개 변수

df

필수

y

기본값: None

is_training_set

기본값: False

preprocess_pred_X_y

예측 X 및 y를 전처리합니다.

preprocess_pred_X_y(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, forecast_destination: Timestamp | None = None) -> Tuple[DataFrame, DataFrame | ndarray, Dict[str, Any]]

매개 변수

X_pred

기본값: None

y_pred

기본값: None

forecast_destination

기본값: None

rolling_evaluation

" 지정된 테스트 세트를 통해 롤링 원본에 대한 예측을 생성합니다.

각 반복은 현재 원점과 관련하여 다음 'max_horizon' 기간에 대한 예측을 수행한 다음, 수평선 기간까지 원본을 진행합니다. 예측자가 지연 기능을 생성하기 위해 현재 원본 시간 이전의 실제 대상 값을 사용하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다.

이 함수는 테스트 세트의 실제와 결합된 롤링 예측의 조인된 DataFrame을 반환합니다.

이 메서드는 더 이상 사용되지 않으며 향후 릴리스에서 제거될 예정입니다. 대신 rolling_forecast()를 사용하세요.

rolling_evaluation(X_pred: DataFrame, y_pred: DataFrame | ndarray, ignore_data_errors: bool = False) -> Tuple[ndarray, DataFrame]

매개 변수

X_pred

필수

X_past 및 X_future를 시간 연속 방식으로 결합하는 예측 데이터 프레임입니다. X_pred의 빈 값은 대체됩니다.

y_pred

필수

X_pred에 해당하는 대상 값입니다.

ignore_data_errors

기본값: False

사용자 데이터의 오류를 무시합니다.

반환

Y_pred, Y_future에 해당하는 하위 프레임이 각각의 예측으로 채워집니다. Y_past의 누락된 값은 imputer로 채워집니다.

반환 형식

tuple

rolling_forecast

테스트 집합을 통해 롤링 원본에 대한 예측을 생성합니다.

각 반복은 현재 원본까지의 정보를 사용하여 앞으로 최대 수평 기간을 예측한 다음, '단계' 기간별로 원본을 진행합니다. 예측이 현재 원본 시간 이전의 실제 대상 값을 사용하여 조회 기능을 생성하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다.

이 함수는 테스트 집합의 실제 항목과 조인된 롤링 예측의 DataFrame을 반환합니다. 반환된 데이터 프레임의 열은 다음과 같습니다.

Timeseries ID 열(선택 사항). 사용자가 제공하는 경우 지정된 열 이름이 사용됩니다.
각 행에 대한 원본 시간을 제공하는 원본 열을 예측합니다.

열 이름: forecast_origin_column_name 개체 멤버 변수로 저장됩니다.
시간 열입니다. 사용자가 지정한 열 이름이 사용됩니다.
예측 값 열입니다. 열 이름: 개체 멤버 forecast_column_name
실제 값 열입니다. 열 이름: 개체 멤버로 저장 actual_column_name

rolling_forecast(X_pred: DataFrame, y_pred: ndarray, step: int = 1, ignore_data_errors: bool = False) -> DataFrame

매개 변수

X_pred: <xref:pd.DataFrame>

필수

예측 데이터 프레임

y_pred: <xref:np.ndarray>

필수

X_pred 행에 해당하는 대상 값

step: int

기본값: 1

각 반복에서 예측 기간을 진행하는 기간 수입니다.

ignore_data_errors: bool

기본값: False

사용자 데이터의 오류를 무시합니다.

반환

롤링 예측의 데이터 프레임

반환 형식

<xref:pd.DataFrame>

short_grain_handling

모델에 대해 시간 조직 처리가 짧거나 없는 경우 true를 반환합니다.

short_grain_handling() -> bool

static_preaggregate_data_set

예측 데이터 세트를 집계합니다.

참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param ts_transformer: 학습에 사용되는 시계열 변환기입니다. :param time_column_name: 시간 열의 이름입니다. :param grain_column_names: 시간 조직 열 이름 목록입니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다.

static static_preaggregate_data_set(ts_transformer: TimeSeriesTransformer, time_column_name: str, grain_column_names: List[str], df: DataFrame, y: ndarray | None = None, is_training_set: bool = False) -> Tuple[DataFrame, ndarray | None]

매개 변수

ts_transformer

필수

time_column_name

필수

grain_column_names

필수

df

필수

y

기본값: None

is_training_set

기본값: False

특성

actual_column_name

forecast_column_name

forecast_origin_column_name

grain_column_list

max_horizon

모델에 사용된 최대 hiorizon을 반환합니다.

origin_col_name

원본 열 이름을 반환합니다.

target_lags

대상 지연을 반환합니다(있는 경우).

target_rolling_window_size

롤링 창의 크기를 반환합니다.

time_column_name

시간 열의 이름을 반환합니다.

user_target_column_name

y_max_dict

시계열 ID별 최대 대상 값이 있는 사전 반환

y_min_dict

시계열 ID별 최소 대상 값으로 사전 반환

FATAL_NO_TARGET_IMPUTER

FATAL_NO_TARGET_IMPUTER = 'No target imputers were found in TimeSeriesTransformer.'

FATAL_NO_TS_TRANSFORM

FATAL_NO_TS_TRANSFORM = 'The time series transform is absent. Please try training model again.'

Share via

ForecastingPipelineWrapperBase 클래스

생성자

매개 변수

메서드

align_output_to_input

매개 변수

fit

매개 변수

forecast

매개 변수

반환

반환 형식

forecast_quantiles

매개 변수

반환

is_grain_dropped

매개 변수

반환

preaggregate_data_set

매개 변수

preprocess_pred_X_y

매개 변수

rolling_evaluation

매개 변수

반환

반환 형식

rolling_forecast

매개 변수

반환

반환 형식

short_grain_handling

static_preaggregate_data_set

매개 변수

특성

actual_column_name

forecast_column_name

forecast_origin_column_name

grain_column_list

max_horizon

origin_col_name

target_lags

target_rolling_window_size

time_column_name

user_target_column_name

y_max_dict

y_min_dict

FATAL_NO_TARGET_IMPUTER

FATAL_NO_TS_TRANSFORM

피드백

피드백

추가 리소스