共用方式為


比較預測模型的預測 (中級資料探勘教學課程)

在本教學課程的先前步驟中,您已建立多個時間序列模型:

  • 每個區域和模型組合的預測,僅根據個別模型及區域的數據進行預測。

  • 根據更新的數據,預測每個區域。

  • 根據匯總的數據,全球範圍內所有模型的預測。

  • 根據匯總的模型,對於北美地區的 M200 模型進行預測。

為了總結時間序列預測的特徵,您將檢閱變更,以瞭解使用擴充或取代數據的選項如何影響預測結果。

擴展模型案例

替換模型案例

在新增數據之後比較原始結果與結果

讓我們看看太平洋地區 M200 產品線的數據,以瞭解使用新數據更新模型如何影響結果。 請記住,原始數據系列於 2004 年 6 月結束,我們已取得 7 月、8 月和 9 月的新數據。

  • 第一欄顯示加入的新數據。

  • 第二欄會根據原始數據系列顯示7月及以後的預測。

  • 第三欄會根據延伸數據顯示預測。

M200 Pacific 已更新實際銷售數據 在新增數據之前預測 擴充預測
7-25-2008 65 32 65
8-25-2008 54 37 54
9-25-2008 61 32 61
10-25-2008 無資料 36 32
11-25-2008 無資料 31 41
12-25-2008 無資料 34 32

您會注意到使用擴充數據的預測(以粗體顯示)完全重複實際數據點。 重複是設計的一部分。 只要有要使用的實際數據點,預測查詢就會傳回實際值,而且只有在新的實際數據點用完之後才會輸出新的預測值。

一般而言,演算法會賦予新數據中的變化更大的權重,而不是模型數據的開頭部分。 不過,在此案例中,新銷售數據僅比上一個時期增長20-30%,因此預計銷售額只會略有上升,之後銷售預測再次下降,更符合新數據前幾個月的趨勢。

比較原始和交叉預測結果

請記住,原始採礦模型揭示了區域與產品線之間的巨大差異。 例如,M200 模型的銷售額非常強勁,而 T1000 模型的銷售額在所有區域都相當低。 此外,某些數列沒有太多數據。 系列是不一致的,這意味著它們沒有相同的起點。

預測 M200 和 T1000 數量的系列

那麼,當您根據以全球銷售額而不是原始數據集為基礎的一般模型進行預測時,預測會如何變更? 若要向自己保證您未遺失任何資訊或扭曲預測,您可以將結果儲存至數據表、將預測數據表聯結至歷史數據數據表,然後繪製這兩組歷史數據和預測。

下圖僅以一個產品線 M200 為基礎。 圖表比較初始採礦模型的預測和匯總採礦模型的預測。

Excel 圖表比較預測

在此圖表中,您可以看到匯總採礦模型會保留值的整體範圍和趨勢,同時將個別數據系列中的波動降至最低。

結論

您已瞭解如何建立和自定義可用於預測的時間序列模型。

您已瞭解如何更新時間序列模型,而不需要重新處理模型,方法是新增數據並使用 參數建立預測,EXTEND_MODEL_CASES。

您已瞭解如何使用 REPLACE_MODEL_CASES 參數,並將模型套用至不同的數據系列,以建立可用於交叉預測的模型。

另請參閱

中級數據探勘教程(Analysis Services - 數據探勘)
時間序列模型查詢範例