探索預測模型 (中繼資料採礦教學課程)
您已建立了預測採礦模型,現在可以利用資料採礦設計師的 [採礦模型檢視器] 索引標籤來探索結果。 Microsoft 時間序列檢視器包含兩個索引標籤:[圖表] 和 [模型]。
此外,您可以對所有模型使用 Microsoft 一般內容樹狀檢視器。 每個檢視針對時間序列模型中的資訊呈現略為不同的面貌。
圖表索引標籤
模型索引標籤
Microsoft 一般內容樹狀檢視器
圖表索引標籤
Microsoft 時間序列檢視器的 [圖表] 索引標籤會以圖形方式顯示每個序列,包括歷程記錄資料和預測。 時間序列圖形中的每個線條代表由產品、區域和可預測屬性構成的唯一組合。
檢視器右側的圖例會根據下拉式清單中的選取項目列出時間序列。 您可以選取和清除圖例中的核取方塊,來控制圖形中所顯示的時間序列。
您也可以變更顯示選項,例如各時間序列所用的色彩,或值是否顯示在圖表中的資料點。
若要選取時間序列
按一下 [採礦模型檢視器] 索引標籤中的 [圖表] 索引標籤 (如果未顯示)。
按一下圖表檢視右側的下拉式清單,選取所有核取方塊。 按一下 [確定]。
圖表現在應包含 24 個不同的序列線條。
在圖表右側的核取方塊中,清除所有有關 Amount 的方塊,以便暫時隱藏以金額為基礎的所有序列線條。
接著,清除與 R750 和 R250 自行車有關的核取方塊。
此圖表現在只包含下列六個序列線條,方便您比較 M200 和 T1000 自行車的趨勢。
M200 Europe: Quantity
M200 North America: Quantity
M200 Pacific: Quantity
T1000 Europe: Quantity
T1000 North America: Quantity
T1000 Pacific: Quantity
此檢視器中顯示的圖表會包含歷程記錄資料和預測的資料。 預測的資料會加上陰影,以便和歷程記錄資料有所區別。 若要更輕鬆地比較不同序列,您也可以變更圖表中各線條的色彩。 如需詳細資訊,請參閱<變更資料採礦檢視器中使用的色彩>。
從趨勢線,可以看到所有區域的總銷售量整體都在增加,且每 12 個月會有一個出現在 12 月的高峰。 此外,您還可以從圖表中看出 T1000 自行車資料的開始時間,比其他產品序列資料晚的多。 因為它是新產品,但此序列是以較少的資料為基礎,因此預測可能不準確。
根據預設,每個時間序列 (以點線表示) 顯示五個預測步驟。 您可以變更這個值,檢視更多或更少的預測。 您也可以在圖表中加入誤差線,以圖形方式檢視預測的標準差。
變更圖表檢視中的預測和顯示選項
嘗試將 [預測步驟] 的值從 [5] 逐漸增加到 [10],然後再設回 [6]。
當歷程記錄資料中有大幅波動時,其波動通常會隨著預測數目增加而重複或甚至幅度加大。 這時您可能需要探究歷程記錄資料中暴增的原因,然後決定是要接受這些結果、尋求來源資料中的某種更正,還是在模型中套用某種平滑效果。
選取 [顯示偏差] 核取方塊。
此選項會顯示每個預測值的預估錯誤。
請注意 X 軸的小數位數。 歷程記錄和預測資料的變更永遠是以百分比表示,但實際值會自動調整,以便將所有值放在圖形上。 因此,在比較模型時需要特別小心,不要只依賴視覺項目。 若要取得實際值,或預測的百分比增量和值,請將滑鼠指標暫時放在點線或實線上方,或按一下線條以檢視 [採礦圖例] 中的值。
提示:如果看不到 [採礦圖例],請切換至 [模型] 檢視,以滑鼠右鍵按一下任何節點,然後選取 [顯示圖例]。
檢視這些趨勢後,您關切某些序列缺少資料,想知道是否可根據模型或地區計算平均銷售量,取得更可靠的預測。 稍後在本教學課程中將探索此方法。
回到頁首
模型索引標籤
在資料採礦設計師的 Microsoft 時間序列檢視器中,[模型] 索引標籤可讓您以樹狀圖形顯示預測模型。
首先,請注意,因為資料針對三個不同區域 (Europe、North America 和 Pacific) 中多個產品線 (T1000 等等) 的銷售描述兩個不同的量值 (Amount 和 Quantity),所以建立的模型實際上包含 24 個不同的樹狀目錄,每個樹狀目錄代表不同區域、產品和可預測屬性之組合的銷售模式模型。
您可以在 [模型] 索引標籤上的 [樹狀目錄] 下拉式清單選取序列,選擇要檢視的產品線、區域和銷售相關數據之組合。
從樹狀檢視的模型中可學到什麼? 舉例來說,假設要比較兩個模型,其中一個有數個樹狀層級,另一個有單一節點。
當樹狀圖形包含單一節點時,這表示模型中的趨勢在一段時間後通常是同質性的。 您可以使用此單一節點 (標示為 [All]),檢視描述輸入變數和結果之間關聯性的公式。
當時間序列的樹狀圖形有多個分支時,這表示偵測到的時間序列太複雜,無法以單一方程式表示。 反之,樹狀圖形中可以包含多個分支,而每個分支以造成樹狀目錄「分割」(Split) 的條件來標示。 當樹狀目錄分割時,每個分支表示不同的時間區段,其中的趨勢可用單一方程式描述。
例如,如果您查看圖表圖形,看到銷售量從 9 月某個時間一直到年底假期暴漲,可以切換至 [模型] 檢視,了解趨勢變更的實際日期。 樹狀目錄中代表「9 月前」和「9 月後」的分支會包含不同的公式:一個公式以數學方式描述分割前的銷售趨勢,另一個公式則描述 9 月到年底假期的銷售趨勢。
瀏覽時間序列模型的決策樹
在檢視器的 [模型] 索引標籤上,選取 [樹狀目錄] 清單中的 [T1000 Europe: Amount] 序列。
按一下標示 [All] 的節點。
針對 [All] 節點,所顯示的工具提示會包含整個序列中的案例數目,以及衍生自資料分析的時間序列方程式等資訊。
如果看不到 [採礦圖例],以滑鼠右鍵按一下節點,然後選取 [顯示圖例]。
[採礦圖例] 提供的資訊與工具提示幾乎相同。 如果有任何離散的獨立變數,您也會看到顯示變數分佈在節點中的長條圖。
現在選取另一個要檢視的時間序列。 使用檢視器的 [模型] 索引標籤上的 [樹狀目錄] 清單,選取 [M200 North America: Amount] 序列。
此時,樹狀圖形包含一個 [All] 節點和兩個子節點。 您可以透過查看子節點上的標籤,了解趨勢線在哪個時間點變更。
對於每個子節點,[採礦圖例] 中的說明也包含樹狀目錄各分支中的案例計數。
下列清單說明樹狀檢視器的一些其他功能:
您可以使用 [背景] 控制項,變更圖表中所表示的變數。 根據預設,節點的色彩愈深,包含的案例愈多,因為 [背景] 的值設定為 [母體]。 如果只要查看節點中有多少案例,請將滑鼠指標暫時放在節點上並檢視出現的工具提示,或在 [節點圖例] 視窗中按一下節點並檢視數目。
也可以在工具提示中或透過按一下節點來檢視節點的迴歸公式。 如果您建立了混合模型,則會看到兩個公式,一個用於 ARTXP (在分葉節點中),另一個用於 ARIMA (在樹狀目錄的根節點中)。
小菱形用於表示連續數字的節點。 菱形所在的橫線上會顯示屬性的範圍。 菱形會在節點的平均值置中,而菱形的寬度代表在該節點的屬性變異數。
回到頁首
(選擇性) 一般內容樹狀檢視器
除了時間序列的自訂檢視器之外,Analysis Services 還提供所有資料採礦模型適用的 Microsoft 一般內容樹狀檢視器。 此檢視器具備一些優點:
Microsoft 時間序列檢視器:此檢視合併兩個演算法的結果。 雖然您可以分別檢視每個序列,但無法判斷各演算法結果如何結合。 此外,在此檢視中,工具提示和採礦圖例只顯示最重要的統計資料。
一般內容樹狀檢視器:讓您同時瀏覽及檢視模型中使用的所有資料序列,如果您建立了混合模型,則會在同一個圖形中同時顯示 ARTXP 和 ARIMA 樹狀目錄。
您可以使用此檢視器取得兩個演算法的所有統計資料,以及值分佈。
建議想要深入了解 ARIMA 和 ARTXP 分析的資料採礦專家使用者採用。
在一般內容樹狀檢視器中檢視特定資料序列的詳細資料
在 [採礦模型檢視器] 索引標籤中,從 [檢視器] 下拉式清單中選取 [Microsoft 一般內容樹狀檢視器]。
在 [節點標題] 窗格中,按一下最頂端的 (All) 節點。
在 [節點詳細資料] 窗格中,檢視 ATTRIBUTE_NAME 的值。
這個值顯示這個節點包含哪一個序列或產品與區域組合。 在 AdventureWorks 範例中,最頂端的節點屬於 M200 Europe 序列。
在 [節點標題] 窗格中,找出第一個包含子節點的節點。
如果一個序列節點包含子節點,Microsoft 時間序列檢視器的 [模型] 索引標籤上所顯示的樹狀檢視也會包含分支結構。
展開該節點,並按一下其中一個子節點。
結構描述的 NODE_DESCRIPTION 資料行包含造成樹狀結構分岔的條件。
在 [節點標題] 窗格中,按一下最頂端的 ARIMA 節點,然後展開節點直到顯示其中所有子節點。
在 [節點詳細資料] 窗格中,檢視 ATTRIBUTE_NAME 的值。
這個值會告訴您這個節點包含哪一個時間序列。 ARIMA 區段中最頂端的節點應該符合 (All) 區段中最頂端的節點。 在 AdventureWorks 範例中,這個節點包含 M200 Europe 序列的 ARIMA 分析。
如需詳細資訊,請參閱<時間序列模型的採礦模型內容 (Analysis Services - 資料採礦)>。
回到頁首