比較用來預測模型的預測 (中繼資料採礦教學課程)
在本教學課程的先前步驟中,您建立了多個時間序列模型:
每一個地區和模型組合的預測 (僅根據個別模型和地區的資料)。
每個地區的預測 (根據更新的資料)。
所有模型的全球預測 (根據彙總資料)。
M200 模型在北美地區的預測 (根據彙總模型)。
為了概述時間序列預測的功能,您將檢閱變更,了解使用擴充或取代資料的選項如何影響預測結果。
EXTEND_MODEL_CASES
REPLACE_MODEL_CASES
比較原始結果與加入資料後的結果
讓我們來看看只與太平洋地區 M200 產品線相關的資料,了解以新資料更新模型會如何影響結果。 請記得原始資料數列在 2004 年 6 月結束,而我們取得 7 月、8 月和 9 月的新資料。
第一個資料行顯示加入的新資料。
第二個資料行顯示 7 月以後根據原始資料數列的預測。
第三個資料行顯示根據擴充資料的預測。
M200 Pacific |
更新的實際銷售資料 |
加入資料之前的預測 |
擴充預測 |
---|---|---|---|
7-25-2008 |
65 |
32 |
65 |
8-25-2008 |
54 |
37 |
54 |
9-25-2008 |
61 |
32 |
61 |
10-25-2008 |
無資料 |
36 |
32 |
11-25-2008 |
無資料 |
31 |
41 |
12-25-2008 |
無資料 |
34 |
32 |
您將會注意到使用擴充資料 (此處以粗體顯示) 的預測完全重複實際資料點。 重複是預設行為。 只要有可用的實際資料點,預測查詢就會傳回實際值,只在新的實際資料點已經用完後才會輸出新的預測值。
一般而言,相較於模型資料開頭的資料,演算法對新資料的變更賦予較重的加權。 不過,在此情況下,新銷售數字比起上一個週期增幅僅為 20-30%,因此對預計銷售造成些微的上揚,在此之後銷售預測轉而向下,重複加入新資料之前月份的趨勢。
比較原始和交叉預測結果
請記得,原始採礦模型揭露地區之間和產品線之間有很大的差異。 例如,M200 模型的銷售非常強,而 T1000 模型的銷售則在所有地區都很低。 此外,有些數列沒有太多的資料。 數列沒有相同的起點,呈現不齊現象。
因此,當您根據一般模型做預測,此模型以全球銷售而不是以原始資料集為基礎,預測會如何變更? 為確保不遺失任何資訊或扭曲預測,您可以將結果儲存至資料表,將預測的資料表聯結至歷程記錄資料的資料表,然後在圖形中顯示兩組歷程記錄資料和預測。
下圖只以 M200 一個產品線為基礎。 圖形將初始採礦模型中的預測與使用彙總採礦模型的預測相比較。
您可以從此圖中得知,彙總採礦模型保留值的整體範圍和趨勢,同時將個別資料數列中的波動降至最低。
結論
您已經學會如何建立及自訂可用於預測的時間序列模型。
您已經學會使用 EXTEND_MODEL_CASES 參數,加入新資料及建立預測來更新時間序列模型,而不需重新處理模型。
您已經學會使用 REPLACE_MODEL_CASES 參數以及將模型套用至不同資料數列,建立可用於交叉預測的模型。