您從探索預測模型中看到,雖然大部分地區的銷售額都遵循類似的模式,但某些區域和某些模型,例如太平洋地區的 M200 模型,則呈現非常不同的趨勢。 這並不奇怪,因為您知道區域之間的差異是常見的,而且可能是由許多因素造成的,包括行銷促銷、不正確的報告或地緣政治事件。
不過,您的使用者要求可在全球套用的模型。 因此,若要將個別因素對預測的影響降到最低,您決定建立以全球銷售匯總量值為基礎的模型。 然後,您可以使用此模型來針對每個個別區域進行預測。
在這項工作中,您將建置執行進階預測工作所需的所有數據源。 您將建立兩個數據源檢視做為預測查詢的輸入,以及一個數據源檢視,以用於建置新的模型。
步驟
建立新的擴充銷售數據
若要更新銷售數據,您必須取得最新的銷售數據。 特別感興趣的是來自太平洋地區的數據,該區域推出了區域銷售促銷,以引起人們對新商店的關注,並提高對產品的認識。
在此案例中,我們將假設數據已從 Excel 活頁簿匯入,其中只包含幾個地區過去三個月的最新數據。 您將使用 Transact-SQL 腳本建立資料的數據表,然後定義要用於預測的數據源檢視。
使用新的銷售數據建立數據表
在 Transact-SQL 查詢視窗中,執行下列語句,將銷售數據新增至 AdventureWorksDW 資料庫(或任何其他資料庫)。
USE [database name]; GO IF OBJECT_ID ([dbo].[NewSalesData]) IS NOT NULL DROP TABLE [dbo].[NewSalesData]; GO CREATE TABLE [dbo].[NewSalesData]([Series] [nvarchar](255) NULL, [NewDate] [datetime] NULL, [NewQty] [float] NULL, [NewAmount] [money] NULL) ON [PRIMARY] GO
使用下列文稿插入新的值。
INSERT INTO [NewSalesData] (Series,NewDate,NewQty,NewAmount) VALUES('T1000 Pacific', '7/25/08', 55, '$130,170.22'), ('T1000 Pacific', '8/25/08', 50, '$114,435.36 '), ('T1000 Pacific', '9/25/08', 50, '$117,296.24 '), ('T1000 Europe', '7/25/08', 37, '$88,210.00 '), ('T1000 Europe', '8/25/08', 41, '$97,746.00 '), ('T1000 Europe', '9/25/08', 37, '$88,210.00 '), ('T1000 North America', '7/25/08', 69, '$164,500.00 '), ('T1000 North America', '8/25/08', 66, '$157,348.00 '), ('T1000 North America', '9/25/08', 58, '$138,276.00 '), ('M200 Pacific', '7/25/08', 65, '$149,824.35'), ('M200 Pacific', '8/25/08', 54, '$124,619.46'), ('M200 Pacific', '9/25/08', 61, '$141,143.39'), ('M200 Europe', '7/25/08', 75, '$173,026.00'), ('M200 Europe', '8/25/08', 76, '$175,212.00'), ('M200 Europe', '9/25/08', 84, '$193,731.00'), ('M200 North America', '7/25/08', 94, '$216,916.00'), ('M200 North America', '8/25/08', 94, '$216,891.00'), ('M200 North America', '9/25/08', 91,'$209,943.00');
警告
引號會與貨幣值搭配使用,以避免發生逗號分隔符和貨幣符號的問題。 您也可以以這個格式傳入貨幣值:
130170.22
請注意,此版本範例資料庫中所使用的日期已變更。 如果您使用舊版的「AdventureWorks」,您可能需要據以調整插入的日期。
使用新的銷售數據建立數據源檢視
在 [方案總管] 中,以滑鼠右鍵按兩下 [數據源檢視],然後選取 [ 新增數據源檢視]。
在 [數據源檢視精靈] 中,進行下列選取:
數據源:Adventure Works DW 多維度 2012
選取 [數據表和檢視]:選取您剛才建立的數據表 NewSalesData。
按一下完成。
在 [數據源檢視] 設計介面中,以滑鼠右鍵按兩下 [NewSalesData],然後選取 [ 探索數據 ] 以確認數據。
警告
您只會使用此數據進行預測,因此數據不完整並不重要。
建立交叉預測模型的數據
原始預測模型中使用的數據已依 vTimeSeries 檢視進行分組,該檢視會將數個自行車模型折疊成較少類別,並將個別國家/地區的結果合併成區域。 若要建立可用於全球投影的模型,您將直接在數據源檢視設計工具中建立一些額外的簡單匯總。 新的數據源檢視只會包含所有區域所有產品銷售的總和和和。
建立用於模型的數據源之後,您必須建立新的數據源檢視以用於預測。 例如,如果您想要使用新的全球模型預測歐洲的銷售量,則必須只向歐洲區域提供數據。 因此,您將設定新的數據源檢視來篩選原始數據,並變更每個預測查詢集的篩選條件。
使用自訂數據源檢視建立模型數據
在 [方案總管] 中,以滑鼠右鍵按兩下 [數據源檢視],然後選取 [ 新增數據源檢視]。
在精靈的歡迎頁面上,按 [下一步]。
在 [ 選取數據源] 頁面上,選取 [Adventure Works DW 多維度 2012],然後按 [ 下一步]。
在頁面的 [選取數據表和檢視] 中,不要新增任何數據表,只要按 [下一步] 即可。
在頁面上,完成精靈,輸入名稱
AllRegions
,然後按一下 完成。接下來,以滑鼠右鍵按兩下空白數據源檢視設計介面,然後選取[ 新增具名查詢]。
在 [ 建立具名查詢 ] 對話框中,針對 [ 名稱],輸入
AllRegions
,針對 [ 描述],輸入 所有模型和區域的銷售總和與平均值。在 [SQL 文字] 窗格中,輸入下列語句,然後按兩下 [確定]:
SELECT ReportingDate, SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty, SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt, 'All Regions' as [Region] FROM dbo.vTimeSeries GROUP BY ReportingDate
以滑鼠右鍵按兩下
AllRegions
資料表,然後選取 [ 探索數據]。
建立交叉預測的數列數據
在 [方案總管] 中,以滑鼠右鍵按兩下 [數據源檢視],然後選取 [ 新增數據源檢視]。
在 [數據源檢視精靈] 中,進行下列選取:
數據源:Adventure Works DW 多維度 2012
選取數據表和檢視:不要選取任何數據表
名稱:
T1000 Pacific Region
按一下完成。
以滑鼠右鍵按兩下 T1000 Pacific Region.dsv 的空白設計介面,然後選取 [ 新增具名查詢]。
[ 建立具名查詢 ] 對話框隨即出現。 重新輸入名稱,然後新增下列描述:
名稱:
T1000 Pacific Region
描述:依區域和模型篩選
vTimeSeries
在文字窗格中,輸入下列查詢,然後按兩下 [確定]:
SELECT ReportingDate, ModelRegion, Quantity, Amount FROM dbo.vTimeSeries WHERE (ModelRegion = N'T1000 Pacific')
備註
因為您必須個別建立每個數列的預測,因此您可能會想要複製查詢文字,並將它儲存至文本檔,以便將它重新用於其他數據系列。
在 [數據源檢視] 設計介面中,以滑鼠右鍵按兩下 [T1000 Pacific],然後選取 [ 探索數據 ] 以確認數據已正確篩選。
建立交叉預測查詢時,您將使用此數據作為模型的輸入。