다음을 통해 공유


시계열 예측 만들기(중간 데이터 마이닝 자습서)

이 단원의 이전 작업에서는 시계열 모델을 만들고 결과를 탐색했습니다. 기본적으로 Analysis Services는 항상 시계열 모델에 대한 5개 예측 집합을 만들고 예측 값을 예측 차트의 일부로 표시합니다. 그러나 DMX(데이터 마이닝 확장) 예측 쿼리를 빌드하여 예측을 만들 수도 있습니다.

이 작업에서는 뷰어에서 본 것과 동일한 예측을 생성하는 예측 쿼리를 만듭니다. 이 작업은 기본 데이터 마이닝 자습서의 단원을 이미 완료했으며 예측 쿼리 작성기를 사용하는 방법을 잘 알고 있다고 가정합니다. 이제 시계열 모델과 관련된 쿼리를 만드는 방법을 알아봅니다.

시계열 예측 만들기

일반적으로 예측 쿼리를 만드는 첫 번째 단계는 마이닝 모델 및 입력 테이블을 선택하는 것입니다. 그러나 시계열 모델에는 일반 예측에 대한 추가 입력이 필요하지 않습니다. 따라서 모델에 데이터를 추가하거나 데이터를 대체하지 않는 한 예측을 수행할 때 새 데이터 원본을 지정할 필요가 없습니다.

이 단원에서는 예측 단계 수를 지정해야 합니다. 계열 이름을 지정하여 제품과 지역의 특정 조합에 대한 예측을 가져올 수 있습니다.

모델 및 입력 테이블을 선택하려면

  1. 데이터 마이닝 디자이너의 마이닝 모델 예측 탭의 마이닝 모델 상자에서 모델 선택을 클릭합니다.

  2. 마이닝 모델 선택 대화 상자에서 예측 구조를 확장하고 목록에서 예측 모델을 선택한 다음 확인을 클릭합니다.

  3. 입력 테이블 선택 상자를 무시합니다.

    비고

    시계열 모델의 경우 교차 예측을 수행하지 않는 한 별도의 입력을 지정할 필요가 없습니다.

  4. 원본 열의 마이닝 모델 예측 탭 표에서 첫 번째 빈 행의 셀을 클릭한 다음 마이닝 모델 예측을 선택합니다.

  5. 필드 열에서 모델 영역을 선택합니다.

    이 작업은 예측 쿼리에 계열 식별자를 추가하여 예측이 적용되는 모델 및 영역의 조합을 나타냅니다.

  6. 원본 열에서 빈 다음 행을 클릭한 다음 예측 함수를 선택합니다.

  7. 필드 열에서 PredictTimeSeries를 선택합니다.

    비고

    시계열 모델에서 함수를 Predict 사용할 수도 있습니다. 그러나 기본적으로 Predict 함수는 각 계열에 대해 하나의 예측만 만듭니다. 따라서 여러 예측 단계를 지정하려면 PredictTimeSeries 함수를 사용해야 합니다.

  8. 마이닝 모델 창에서 마이닝 모델 열인 Amount를 선택합니다. 앞에서 추가한 PredictTimeSeries 함수의 조건/인수 상자로 크기를 끌어옵니다.

  9. 조건/인수 상자를 클릭하고 필드 이름 뒤에 쉼표, 5를 차례로 입력합니다.

    이제 조건/인수 상자의 텍스트에 다음이 표시됩니다.

    [Forecasting].[Amount],5

  10. 별칭 열에 PredictAmount를 입력합니다.

  11. 원본 열에서 다음 빈 행을 클릭한 다음 예측 함수를 다시 선택합니다.

  12. 필드 열에서 PredictTimeSeries를 선택합니다.

  13. 마이닝 모델 창에서 수량 열을 선택한 다음 두 번째 PredictTimeSeries 함수의 조건/인수 상자로 끌어옵니다.

  14. 조건/인수 상자를 클릭하고 필드 이름 뒤에 쉼표, 5를 차례로 입력합니다.

    이제 조건/인수 상자의 텍스트에 다음이 표시됩니다.

    [Forecasting].[ Quantity],5

  15. 별칭 열에서 PredictQuantity을 입력합니다.

  16. 쿼리 결과 보기로 전환을 클릭하세요.

    쿼리 결과는 테이블 형식으로 표시됩니다.

쿼리 작성기에서 세 가지 유형의 결과를 만들었는데, 하나는 열의 값을 사용하고, 두 가지는 예측 함수에서 예측 값을 가져오는 결과입니다. 따라서 쿼리 결과에는 세 개의 개별 열이 포함됩니다. 첫 번째 열에는 제품 및 지역 조합 목록이 포함됩니다. 두 번째 및 세 번째 열에는 각각 예측 결과의 중첩 테이블이 포함됩니다. 중첩된 각 테이블에는 다음 테이블과 같은 시간 단계 및 예측 값이 포함됩니다.

예제 결과(두 소수 자릿수로 크기가 잘림):

M200 유럽 예측 금액

$TIME 금액
7/25/2008 99978.00
8/25/2008 145575.07
9/25/2008 116835.19
10/25/2008 116537.38
11/25/2008 107760.55

M200 Europe PredictQuantity

$TIME 수량
7/25/2008 52
8/25/2008 67
9/25/2008 58
10/25/2008 57
11/25/2008 54

M200 북아메리카 - PredictAmount

$TIME 금액
7/25/2008 348533.93
8/25/2008 340097.98
9/25/2008 257986.19
10/25/2008 374658.24
11/25/2008 379241.44

M200 북아메리카 - PredictQuantity

$TIME 수량
7/25/2008 272
8/25/2008 152
9/25/2008 250
10/25/2008 181
11/25/2008 290

경고

샘플 데이터베이스에서 사용되는 날짜가 이 릴리스에 대해 변경되었습니다. 이전 버전의 샘플 데이터를 사용하는 경우 다른 결과가 표시될 수 있습니다.

예측 결과 저장

예측 결과를 사용하기 위한 여러 가지 옵션이 있습니다. 결과를 평면화하고 결과 보기에서 데이터를 복사한 다음 Excel 워크시트 또는 다른 파일에 붙여넣을 수 있습니다.

데이터 마이닝 디자이너는 결과를 저장하는 프로세스를 간소화하기 위해 데이터 원본 뷰에 데이터를 저장하는 기능도 제공합니다. 결과를 데이터 원본 뷰에 저장하는 기능은 SSDT(SQL Server Data Tools)에서만 사용할 수 있습니다. 결과는 평면화된 형식으로만 저장할 수 있습니다.

결과 창에서 결과를 평면화하려면

  1. 예측 쿼리 작성기에서 스위치를 클릭하여 쿼리 디자인 보기를 클릭합니다.

    DMX 쿼리 텍스트를 수동으로 편집할 수 있도록 보기가 변경됩니다.

  2. SELECT 키워드 후에 FLATTENED 키워드를 입력합니다. 전체 쿼리 텍스트는 다음과 같습니다.

    SELECT FLATTENED  
      [Forecasting].[Model Region],  
      (PredictTimeSeries([Forecasting].[Amount],5)) as [PredictAmount],  
      (PredictTimeSeries([Forecasting].[Quantity],5)) as [PredictQuantity]  
    FROM  
      [Forecasting]  
    
  3. 필요에 따라 다음 예제와 같이 결과를 제한하는 절을 입력할 수 있습니다.

    SELECT FLATTENED  
      [Forecasting].[Model Region],  
      (PredictTimeSeries([Forecasting].[Amount],5)) as [PredictAmount],  
      (PredictTimeSeries([Forecasting].[Quantity],5)) as [PredictQuantity]  
    FROM  
      [Forecasting]  
    WHERE [Forecasting].[Model Region] = 'M200 North America'   
    OR [Forecasting].[Model Region] = 'M200 Europe'  
    
    
  4. 쿼리 결과 보기로 전환을 클릭하십시오.

예측 쿼리 결과를 내보내려면

  1. 쿼리 결과 저장을 클릭합니다.

  2. 데이터 마이닝 쿼리 결과 저장 대화 상자에서 데이터 원본에 대해 AdventureWorksDW2012를 선택합니다. 데이터를 다른 관계형 데이터베이스에 저장하려는 경우 데이터 원본을 만들 수도 있습니다.

  3. 테이블 이름 열에 테스트 예측과 같은 새 임시 테이블 이름을 입력합니다.

  4. 저장을 클릭합니다.

    비고

    만든 테이블을 보려면 데이터를 저장한 인스턴스의 데이터베이스 엔진에 대한 연결을 만들고 쿼리를 만듭니다.

결론

기본 시계열 모델을 빌드하고, 예측을 해석하고, 예측을 만드는 방법을 알아보았습니다.

이 자습서의 나머지 작업은 선택 사항이며 고급 시계열 예측을 설명합니다. 계속하기로 결정한 경우 모델에 새 데이터를 추가하고 확장된 계열에 대한 예측을 만드는 방법을 알아봅니다. 또한 모델의 추세를 사용하지만 데이터를 새 일련의 데이터로 대체하여 교차 예측을 수행하는 방법을 알아봅니다.

다음 단원:

고급 시계열 예측(중간 데이터 마이닝 자습서)

또한 참조하십시오

시계열 모델 쿼리 예제