共用方式為


自訂及處理預測模型 (中繼資料採礦教學課程)

Microsoft 時間序列演算法提供會影響模型建立方式以及時間資料分析方式的參數。 變更這些屬性會對採礦模型如何進行預測造成重大的影響。

在本教學課程的這項工作中,您將執行下列工作以修改模型:

  1. 您將加入 PERIODICITY_HINT 參數的新值,自訂模型處理時間週期的方式。

  2. 您將學習 Microsoft 時間序列演算法的兩個其他重要參數:FORECAST_METHOD 和 PREDICTION_SMOOTHING。前者讓您控制用於預測的方法,後者則讓您自訂長期和短期預測的混合。

  3. 您可以選擇告知演算法要如何計算遺漏值。

  4. 進行完所有變更之後,您將部署及處理模型。

設定時間序列參數

週期性提示

PERIODICITY_HINT 參數提供演算法有關資料中可預見的其他時間週期資訊。 根據預設,時間序列模型會嘗試自動在資料中偵測模式。 不過,如果您已經知道預期的時間循環,提供週期性提示可能會改進模型的精確度。 提供錯誤的週期性提示則可能會降低精確度;因此,如果您不確定應該使用哪個值,最好使用預設值。

例如,此模型所用的檢視每月會從 Adventure Works DW Multidimensional 2012 彙總銷售資料。 因此,模型所用的每個時間配量表示一個月,所有預測也是以月為單位。 因為一年有 12 個月,而您預期銷售模式幾乎每年重複,所以將 PERIODICITY_HINT 參數設定為 12,表示 12 個時間配量 (月) 構成一個完整的銷售循環。

預測方法

FORECAST_METHOD 參數控制著時間序列演算法是否已針對短期或長期預測進行最佳化。 根據預設,FORECAST_METHOD 參數會設為 MIXED,表示兩個不同的演算法會混合並取得平衡,以提供良好的短期和長期預測結果。

但是,如果您知道要使用特定的演算法,可以將值變更為 ARIMA 或 ARTXP。

長期與 短期預測加權

您也可以使用 PREDICTION_SMOOTHING 參數來自訂長期和短期預測的混合方式。 依預設,此參數設為 0.5,一般而言可以提供整體精確度的最佳平衡。

若要變更演算法參數

  1. [採礦模型] 索引標籤中,以滑鼠右鍵按一下 [預測],再選取 [設定演算法參數]

  2. [演算法參數] 對話方塊的 PERIODICITY_HINT 資料列中,按一下 [Value] 資料行,然後輸入 {12} (包含大括號)。

    根據預設,演算法也會加入 {1} 值。

  3. [FORECAST_METHOD] 資料列中,確認 [Value] 文字方塊不是空白就是設定為 MIXED。 如果輸入了不同的值,請輸入 MIXED,將參數變更回預設值。

  4. [PREDICTION_SMOOTHING] 資料列中,確認 [Value] 文字方塊不是空白就是設定為 0.5。 如果輸入了不同的值,請按一下 [Value] 並輸入 0.5,將參數變更回預設值。

    [!附註]

    PREDICTION_SMOOTHING 參數只適用於 SQL Server Enterprise。 因此,您無法在 SQL Server Standard 之中檢視或變更 PREDICTION_SMOOTHING 參數的值。 不過,預設行為是使用兩種演算法並且平均分配其權重。

  5. 按一下 [確定]

處理遺漏資料 (選擇性)

在許多情況下,您的銷售資料可能有填滿 Null 的間距,或可能有某分店錯過了報告期限,導致序列結尾處出現空白資料格。 在這種情況下,Analysis Services 會發出下列錯誤,而且不處理模型。

「錯誤 (資料採礦):從採礦模型 <模型名稱> 的系列 <序列名稱> 起,時間戳記並未同步處理。 所有時間序列都必須在同一個時間標示結束,且不能有任意遺漏資料點。 將 MISSING_VALUE_SUBSTITUTION 參數設定為 Previous 或數值常數,即可在適用時自動修補遺漏的資料點。」

若要避免這個錯誤,您可以指定 Analysis Services 使用下列任何一個方法,自動提供新值以填滿間距:

  • 使用平均值。 平均值是使用相同資料序列中的全部有效值來計算。

  • 使用上一個值。 您可以將多個遺漏的資料格取代為上一個值,但是不可以填入起始值。

  • 使用您套用的常數值。

若要指定以平均值填滿間距

  1. [採礦模型] 索引標籤中,以滑鼠右鍵按一下 [預測] 資料行,再選取 [設定演算法參數]

  2. [演算法參數] 對話方塊的 [MISSING_VALUE_SUBSTITUTION] 資料列中,按一下 [Value] 資料行,然後輸入 Mean。

建立模型

若要使用模型,您必須將它部署至伺服器,然後透過演算法執行定型資料來處理模型。

若要處理預測模型

  1. 在 SQL Server Data Tools 的 [採礦模型] 功能表上,選取 [處理採礦結構和所有模型]

  2. 當警告訊息詢問您是否想要建立及部署專案時,請按一下 [是]

  3. [處理採礦結構 – 預測] 對話方塊中,按一下 [執行]

    隨即開啟 [處理進度] 對話方塊,其中顯示處理模型的相關資訊。 處理模型可能需要花一些時間。

  4. 在處理完成之後,按一下 [關閉] 以結束 [處理進度] 對話方塊。

  5. 再次按一下 [關閉],結束 [處理採礦結構 – 預測] 對話方塊。

本課程的下一項工作

探索預測模型 (中繼資料採礦教學課程)

請參閱

參考

Microsoft 時間序列演算法技術參考

概念

Microsoft 時間序列演算法

處理需求和考量 (資料採礦)