共用方式為


進階時間序列預測 (元數據採礦教學課程)

您從探索預測模型中看到,雖然大部分地區的銷售額都遵循類似的模式,但某些區域和某些模型,例如太平洋地區的 M200 模型,則呈現非常不同的趨勢。 這並不奇怪,因為您知道區域之間的差異是常見的,而且可能是由許多因素造成的,包括行銷促銷、不正確的報告或地緣政治事件。

不過,您的使用者要求可在全球套用的模型。 因此,若要將個別因素對預測的影響降到最低,您決定建立以全球銷售匯總量值為基礎的模型。 然後,您可以使用此模型來針對每個個別區域進行預測。

在這項工作中,您將建置執行進階預測工作所需的所有數據源。 您將建立兩個數據源檢視做為預測查詢的輸入,以及一個數據源檢視,以用於建置新的模型。

步驟

  1. 準備延伸銷售資料(用於預測)

  2. 準備匯總的數據(用於建置模型)

  3. 準備數位資料(用於交叉預測)

  4. 使用 EXTEND 進行預測

  5. 建立交叉預測模型

  6. 使用 REPLACE 預測

  7. 檢閱新的預測

建立新的擴充銷售數據

若要更新銷售數據,您必須取得最新的銷售數據。 特別感興趣的是來自太平洋地區的數據,該區域推出了區域銷售促銷,以引起人們對新商店的關注,並提高對產品的認識。

在此案例中,我們將假設數據已從 Excel 活頁簿匯入,其中只包含幾個地區過去三個月的最新數據。 您將使用 Transact-SQL 腳本建立資料的數據表,然後定義要用於預測的數據源檢視。

使用新的銷售數據建立數據表

  1. 在 Transact-SQL 查詢視窗中,執行下列語句,將銷售數據新增至 AdventureWorksDW 資料庫(或任何其他資料庫)。

    USE [database name];  
    GO  
    IF OBJECT_ID ([dbo].[NewSalesData]) IS NOT NULL   
        DROP TABLE [dbo].[NewSalesData];  
    GO  
    CREATE TABLE [dbo].[NewSalesData]([Series] [nvarchar](255) NULL,  
    [NewDate] [datetime] NULL,  
    [NewQty] [float] NULL,  
    [NewAmount] [money] NULL) ON [PRIMARY]  
    
    GO  
    
  2. 使用下列文稿插入新的值。

    INSERT INTO [NewSalesData]  
    (Series,NewDate,NewQty,NewAmount)  
    VALUES('T1000 Pacific', '7/25/08', 55, '$130,170.22'),  
    ('T1000 Pacific', '8/25/08', 50, '$114,435.36 '),  
    ('T1000 Pacific', '9/25/08', 50, '$117,296.24 '),  
    ('T1000 Europe', '7/25/08', 37, '$88,210.00 '),  
    ('T1000 Europe', '8/25/08', 41, '$97,746.00 '),  
    ('T1000 Europe', '9/25/08', 37, '$88,210.00 '),  
    ('T1000 North America', '7/25/08', 69, '$164,500.00 '),  
    ('T1000 North America', '8/25/08', 66, '$157,348.00 '),  
    ('T1000 North America', '9/25/08', 58, '$138,276.00 '),  
    ('M200 Pacific', '7/25/08', 65, '$149,824.35'),  
    ('M200 Pacific', '8/25/08', 54,  '$124,619.46'),  
    ('M200 Pacific', '9/25/08', 61, '$141,143.39'),  
    ('M200 Europe', '7/25/08', 75, '$173,026.00'),  
    ('M200 Europe', '8/25/08', 76, '$175,212.00'),  
    ('M200 Europe', '9/25/08', 84, '$193,731.00'),  
    ('M200 North America', '7/25/08', 94, '$216,916.00'),  
    ('M200 North America', '8/25/08', 94, '$216,891.00'),  
    ('M200 North America', '9/25/08', 91,'$209,943.00');  
    

    警告

    引號會與貨幣值搭配使用,以避免發生逗號分隔符和貨幣符號的問題。 您也可以以這個格式傳入貨幣值:130170.22

    請注意,此版本範例資料庫中所使用的日期已變更。 如果您使用舊版的「AdventureWorks」,您可能需要據以調整插入的日期。

使用新的銷售數據建立數據源檢視

  1. [方案總管] 中,以滑鼠右鍵按兩下 [數據源檢視],然後選取 [ 新增數據源檢視]。

  2. 在 [數據源檢視精靈] 中,進行下列選取:

    數據源:Adventure Works DW 多維度 2012

    選取 [數據表和檢視]:選取您剛才建立的數據表 NewSalesData。

  3. 按一下完成

  4. 在 [數據源檢視] 設計介面中,以滑鼠右鍵按兩下 [NewSalesData],然後選取 [ 探索數據 ] 以確認數據。

警告

您只會使用此數據進行預測,因此數據不完整並不重要。

建立交叉預測模型的數據

原始預測模型中使用的數據已依 vTimeSeries 檢視進行分組,該檢視會將數個自行車模型折疊成較少類別,並將個別國家/地區的結果合併成區域。 若要建立可用於全球投影的模型,您將直接在數據源檢視設計工具中建立一些額外的簡單匯總。 新的數據源檢視只會包含所有區域所有產品銷售的總和和和。

建立用於模型的數據源之後,您必須建立新的數據源檢視以用於預測。 例如,如果您想要使用新的全球模型預測歐洲的銷售量,則必須只向歐洲區域提供數據。 因此,您將設定新的數據源檢視來篩選原始數據,並變更每個預測查詢集的篩選條件。

使用自訂數據源檢視建立模型數據

  1. [方案總管] 中,以滑鼠右鍵按兩下 [數據源檢視],然後選取 [ 新增數據源檢視]。

  2. 在精靈的歡迎頁面上,按 [下一步]。

  3. 在 [ 選取數據源] 頁面上,選取 [Adventure Works DW 多維度 2012],然後按 [ 下一步]。

  4. 在頁面的 [選取數據表和檢視] 中,不要新增任何數據表,只要按 [下一步] 即可。

  5. 在頁面上,完成精靈,輸入名稱 AllRegions,然後按一下 完成

  6. 接下來,以滑鼠右鍵按兩下空白數據源檢視設計介面,然後選取[ 新增具名查詢]。

  7. 在 [ 建立具名查詢 ] 對話框中,針對 [ 名稱],輸入 AllRegions,針對 [ 描述],輸入 所有模型和區域的銷售總和與平均值

  8. 在 [SQL 文字] 窗格中,輸入下列語句,然後按兩下 [確定]:

    SELECT ReportingDate,   
    SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty,  
    SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt,  
    'All Regions' as [Region]  
    FROM dbo.vTimeSeries   
    GROUP BY ReportingDate  
    
  9. 以滑鼠右鍵按兩下 AllRegions 資料表,然後選取 [ 探索數據]。

建立交叉預測的數列數據

  1. [方案總管] 中,以滑鼠右鍵按兩下 [數據源檢視],然後選取 [ 新增數據源檢視]。

  2. 在 [數據源檢視精靈] 中,進行下列選取:

    數據源:Adventure Works DW 多維度 2012

    選取數據表和檢視:不要選取任何數據表

    名稱T1000 Pacific Region

  3. 按一下完成

  4. 以滑鼠右鍵按兩下 T1000 Pacific Region.dsv 的空白設計介面,然後選取 [ 新增具名查詢]。

    [ 建立具名查詢 ] 對話框隨即出現。 重新輸入名稱,然後新增下列描述:

    名稱T1000 Pacific Region

    描述依區域和模型篩選vTimeSeries

  5. 在文字窗格中,輸入下列查詢,然後按兩下 [確定]:

    SELECT ReportingDate, ModelRegion, Quantity, Amount  
    FROM dbo.vTimeSeries  
    WHERE (ModelRegion = N'T1000 Pacific')  
    

    備註

    因為您必須個別建立每個數列的預測,因此您可能會想要複製查詢文字,並將它儲存至文本檔,以便將它重新用於其他數據系列。

  6. 在 [數據源檢視] 設計介面中,以滑鼠右鍵按兩下 [T1000 Pacific],然後選取 [ 探索數據 ] 以確認數據已正確篩選。

    建立交叉預測查詢時,您將使用此數據作為模型的輸入。

課程中的下一個工作

使用更新的資料進行時間序列預測 (元數據採礦教學課程)

另請參閱

Microsoft時間序列演算法
Microsoft 時間序列演算法技術參考
多維度模型中的數據源檢視