ForecastingPipelineWrapperBase 클래스
예측 모델 래퍼의 기본 클래스입니다.
- 상속
-
ForecastingPipelineWrapperBase
생성자
ForecastingPipelineWrapperBase(ts_transformer: TimeSeriesTransformer | None = None, y_transformer: Pipeline | None = None, metadata: Dict[str, Any] | None = None)
매개 변수
- ts_transformer
- y_transformer
- metadata
메서드
align_output_to_input |
변환된 출력 데이터 프레임을 입력 데이터 프레임에 정렬합니다. 참고: 변환된 항목은 참조로 수정되며 사본이 만들어지지 않습니다. :param X_input: 입력 데이터 프레임입니다. :param transformed: 변환 후의 데이터 프레임입니다. :returns: 원래 인덱스로 변환된 데이터 프레임이지만 X_input과 같은 방법으로 정렬됩니다. |
fit |
입력 X 및 y를 사용하여 모델에 맞습니다. |
forecast |
데이터 프레임 X_pred에서 예측을 수행합니다. |
forecast_quantiles |
맞춤 파이프라인에서 예측 및 분위수를 가져옵니다. |
is_grain_dropped |
시간 조직이 삭제되는 경우 true를 반환합니다. |
preaggregate_data_set |
예측 데이터 세트를 집계합니다. 참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다. |
preprocess_pred_X_y |
예측 X 및 y를 전처리합니다. |
rolling_evaluation |
" 지정된 테스트 세트를 통해 롤링 원본에 대한 예측을 생성합니다. 각 반복은 현재 원점과 관련하여 다음 'max_horizon' 기간에 대한 예측을 수행한 다음, 수평선 기간까지 원본을 진행합니다. 예측자가 지연 기능을 생성하기 위해 현재 원본 시간 이전의 실제 대상 값을 사용하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다. 이 함수는 테스트 세트의 실제와 결합된 롤링 예측의 조인된 DataFrame을 반환합니다. 이 메서드는 더 이상 사용되지 않으며 향후 릴리스에서 제거될 예정입니다. 대신 rolling_forecast()를 사용하세요. |
rolling_forecast |
테스트 집합을 통해 롤링 원본에 대한 예측을 생성합니다. 각 반복은 현재 원본까지의 정보를 사용하여 앞으로 최대 수평 기간을 예측한 다음, '단계' 기간별로 원본을 진행합니다. 예측이 현재 원본 시간 이전의 실제 대상 값을 사용하여 조회 기능을 생성하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다. 이 함수는 테스트 집합의 실제 항목과 조인된 롤링 예측의 DataFrame을 반환합니다. 반환된 데이터 프레임의 열은 다음과 같습니다.
|
short_grain_handling |
모델에 대해 시간 조직 처리가 짧거나 없는 경우 true를 반환합니다. |
static_preaggregate_data_set |
예측 데이터 세트를 집계합니다. 참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param ts_transformer: 학습에 사용되는 시계열 변환기입니다. :param time_column_name: 시간 열의 이름입니다. :param grain_column_names: 시간 조직 열 이름 목록입니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다. |
align_output_to_input
변환된 출력 데이터 프레임을 입력 데이터 프레임에 정렬합니다.
참고: 변환된 항목은 참조로 수정되며 사본이 만들어지지 않습니다. :param X_input: 입력 데이터 프레임입니다. :param transformed: 변환 후의 데이터 프레임입니다. :returns: 원래 인덱스로 변환된 데이터 프레임이지만 X_input과 같은 방법으로 정렬됩니다.
align_output_to_input(X_input: DataFrame, transformed: DataFrame) -> DataFrame
매개 변수
- X_input
- transformed
fit
입력 X 및 y를 사용하여 모델에 맞습니다.
fit(X: DataFrame, y: ndarray) -> ForecastingPipelineWrapperBase
매개 변수
- X
입력 X 데이터입니다.
- y
y 데이터를 입력합니다.
forecast
데이터 프레임 X_pred에서 예측을 수행합니다.
forecast(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, forecast_destination: Timestamp | None = None, ignore_data_errors: bool = False) -> Tuple[ndarray, DataFrame]
매개 변수
- X_pred
X_past 및 X_future를 시간 연속 방식으로 결합하는 예측 데이터 프레임입니다. X_pred의 빈 값은 대체됩니다.
- y_pred
y_past의 확정 값과 Y_future의 누락 값을 결합한 대상 값입니다. None이면 모든 X_pred에 대해 예측이 이루어집니다.
- forecast_destination
- <xref:pandas.Timestamp>
Forecast_destination: 타임스탬프 값입니다. 모든 시간 조직에 대해 Forecast_destination 시간까지 예측이 이루어집니다. 사전 입력 { 시간 조직 -> 타임스탬프 }는 허용되지 않습니다. Forecast_destination이 제공되지 않으면 모든 시간 조직에 대해 X_pred에서 발생한 마지막 시간으로 간주됩니다.
반환
Y_pred, Y_future에 해당하는 하위 프레임이 각각의 예측으로 채워집니다. Y_past의 누락된 값은 imputer로 채워집니다.
반환 형식
forecast_quantiles
맞춤 파이프라인에서 예측 및 분위수를 가져옵니다.
forecast_quantiles(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, quantiles: float | List[float] | None = None, forecast_destination: Timestamp | None = None, ignore_data_errors: bool = False) -> DataFrame
매개 변수
- X_pred
X_past 및 X_future를 시간 연속 방식으로 결합하는 예측 데이터 프레임입니다. X_pred의 빈 값은 대체됩니다.
- y_pred
y_past의 확정 값과 Y_future의 누락 값을 결합한 대상 값입니다. None이면 모든 X_pred에 대해 예측이 이루어집니다.
- forecast_destination
- <xref:pandas.Timestamp>
Forecast_destination: 타임스탬프 값입니다. 모든 시간 조직에 대해 Forecast_destination 시간까지 예측이 이루어집니다. 사전 입력 { 시간 조직 -> 타임스탬프 }는 허용되지 않습니다. Forecast_destination이 제공되지 않으면 모든 시간 조직에 대해 X_pred에서 발생한 마지막 시간으로 간주됩니다.
반환
요청된 분위수에서 수행한 열 및 예측을 포함하는 데이터 프레임입니다.
is_grain_dropped
시간 조직이 삭제되는 경우 true를 반환합니다.
is_grain_dropped(grain: Tuple[str] | str | List[str]) -> bool
매개 변수
- grain
삭제될지 여부를 테스트하는 시간 조직입니다.
반환
시간 조직이 삭제되는 경우 true입니다.
preaggregate_data_set
예측 데이터 세트를 집계합니다.
참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다.
preaggregate_data_set(df: DataFrame, y: ndarray | None = None, is_training_set: bool = False) -> Tuple[DataFrame, ndarray | None]
매개 변수
- df
- y
- is_training_set
preprocess_pred_X_y
예측 X 및 y를 전처리합니다.
preprocess_pred_X_y(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, forecast_destination: Timestamp | None = None) -> Tuple[DataFrame, DataFrame | ndarray, Dict[str, Any]]
매개 변수
- X_pred
- y_pred
- forecast_destination
rolling_evaluation
" 지정된 테스트 세트를 통해 롤링 원본에 대한 예측을 생성합니다.
각 반복은 현재 원점과 관련하여 다음 'max_horizon' 기간에 대한 예측을 수행한 다음, 수평선 기간까지 원본을 진행합니다. 예측자가 지연 기능을 생성하기 위해 현재 원본 시간 이전의 실제 대상 값을 사용하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다.
이 함수는 테스트 세트의 실제와 결합된 롤링 예측의 조인된 DataFrame을 반환합니다.
이 메서드는 더 이상 사용되지 않으며 향후 릴리스에서 제거될 예정입니다. 대신 rolling_forecast()를 사용하세요.
rolling_evaluation(X_pred: DataFrame, y_pred: DataFrame | ndarray, ignore_data_errors: bool = False) -> Tuple[ndarray, DataFrame]
매개 변수
- X_pred
X_past 및 X_future를 시간 연속 방식으로 결합하는 예측 데이터 프레임입니다. X_pred의 빈 값은 대체됩니다.
- y_pred
X_pred에 해당하는 대상 값입니다.
- ignore_data_errors
사용자 데이터의 오류를 무시합니다.
반환
Y_pred, Y_future에 해당하는 하위 프레임이 각각의 예측으로 채워집니다. Y_past의 누락된 값은 imputer로 채워집니다.
반환 형식
rolling_forecast
테스트 집합을 통해 롤링 원본에 대한 예측을 생성합니다.
각 반복은 현재 원본까지의 정보를 사용하여 앞으로 최대 수평 기간을 예측한 다음, '단계' 기간별로 원본을 진행합니다. 예측이 현재 원본 시간 이전의 실제 대상 값을 사용하여 조회 기능을 생성하도록 각 예측에 대한 예측 컨텍스트가 설정됩니다.
이 함수는 테스트 집합의 실제 항목과 조인된 롤링 예측의 DataFrame을 반환합니다. 반환된 데이터 프레임의 열은 다음과 같습니다.
Timeseries ID 열(선택 사항). 사용자가 제공하는 경우 지정된 열 이름이 사용됩니다.
각 행에 대한 원본 시간을 제공하는 원본 열을 예측합니다.
열 이름: forecast_origin_column_name 개체 멤버 변수로 저장됩니다.
시간 열입니다. 사용자가 지정한 열 이름이 사용됩니다.
예측 값 열입니다. 열 이름: 개체 멤버 forecast_column_name
실제 값 열입니다. 열 이름: 개체 멤버로 저장 actual_column_name
rolling_forecast(X_pred: DataFrame, y_pred: ndarray, step: int = 1, ignore_data_errors: bool = False) -> DataFrame
매개 변수
- X_pred
- <xref:pd.DataFrame>
예측 데이터 프레임
- y_pred
- <xref:np.ndarray>
X_pred 행에 해당하는 대상 값
반환
롤링 예측의 데이터 프레임
반환 형식
short_grain_handling
모델에 대해 시간 조직 처리가 짧거나 없는 경우 true를 반환합니다.
short_grain_handling() -> bool
static_preaggregate_data_set
예측 데이터 세트를 집계합니다.
참고: 이 메서드는 데이터 세트가 집계될 것이라고 보장하지 않습니다. 데이터 세트에 중복된 타임스탬프가 있거나 데이터 세트가 그리드 날짜를 벗어난 경우에만 발생합니다. :param ts_transformer: 학습에 사용되는 시계열 변환기입니다. :param time_column_name: 시간 열의 이름입니다. :param grain_column_names: 시간 조직 열 이름 목록입니다. :param df: 집계할 데이터 세트입니다. :patam y: 대상 값입니다. :param is_training_set: true이면 데이터가 학습 세트를 나타냅니다. :return: 집계된 데이터 세트 또는 집계가 필요 없는 경우 그대로 유지되는 데이터 세트입니다.
static static_preaggregate_data_set(ts_transformer: TimeSeriesTransformer, time_column_name: str, grain_column_names: List[str], df: DataFrame, y: ndarray | None = None, is_training_set: bool = False) -> Tuple[DataFrame, ndarray | None]
매개 변수
- ts_transformer
- time_column_name
- grain_column_names
- df
- y
- is_training_set
특성
actual_column_name
forecast_column_name
forecast_origin_column_name
grain_column_list
max_horizon
모델에 사용된 최대 hiorizon을 반환합니다.
origin_col_name
원본 열 이름을 반환합니다.
target_lags
대상 지연을 반환합니다(있는 경우).
target_rolling_window_size
롤링 창의 크기를 반환합니다.
time_column_name
시간 열의 이름을 반환합니다.
user_target_column_name
y_max_dict
시계열 ID별 최대 대상 값이 있는 사전 반환
y_min_dict
시계열 ID별 최소 대상 값으로 사전 반환
FATAL_NO_TARGET_IMPUTER
FATAL_NO_TARGET_IMPUTER = 'No target imputers were found in TimeSeriesTransformer.'
FATAL_NO_TS_TRANSFORM
FATAL_NO_TS_TRANSFORM = 'The time series transform is absent. Please try training model again.'
피드백
https://aka.ms/ContentUserFeedback
출시 예정: 2024년 내내 콘텐츠에 대한 피드백 메커니즘으로 GitHub 문제를 단계적으로 폐지하고 이를 새로운 피드백 시스템으로 바꿀 예정입니다. 자세한 내용은 다음을 참조하세요.다음에 대한 사용자 의견 제출 및 보기