既然您已瞭解班次、作員數目、呼叫和服務等級之間的互動,您已準備好建立一些可用於商務分析和規劃的預測查詢。 您必須先在探勘模型上建立一些預測,以測試一些假設。 接下來,您將使用羅吉斯回歸模型來建立大量預測。
本課程假設您已經熟悉預測查詢的概念。
使用類神經網路模型建立預測
下列範例示範如何使用為了探索而建立的類神經網路模型,進行單一預測。 單一值預測是一種嘗試不同值以查看對模型影響的好方法。 在此案例中,如果有六名經驗豐富的作員值班,您將預測午夜班次的服務等級(未指定一周中的一天)。
使用類神經網路模型建立單一查詢
在 SQL Server Data Tools (SSDT) 中,開啟包含您要使用的模型的解決方案。
在 [數據採礦設計師] 中,按兩下 [ 採礦模型預測 ] 索引標籤。
在 [ 採礦模型] 窗格中,按兩下 [ 選取模型]。
[ 選取採礦模型] 對話框會顯示採礦結構清單。 展開採礦結構,以檢視與該結構相關聯的採礦模型清單。
展開採礦結構 [通話中心預設值],然後選取神經網路模型,即通話中心 - LR。
從 [ 採礦模型] 功能表中,選取 [單一查詢]。
[ 單一查詢輸入 ] 對話框隨即出現,且數據行對應至採礦模型中的數據行。
在 單一查詢輸入 對話方塊中,按一下 Shift 的列,然後選取 午夜。
點選等級 2 運算子的資料列,然後輸入
6。在 採礦模型預測 標籤頁的下半部,點選方格中的第一列。
在 [ 來源] 數據行中,按兩下向下箭號,然後選取 [預測函數]。 在 欄位 中,選取 PredictHistogram。
您可以搭配此預測函數使用的引數清單會自動出現在準則/引數方塊中。
將 ServiceGrade 欄位從 採礦模型 窗格中的欄位清單拖曳至 準則/自變數 方塊。
數據行的名稱會自動插入為 自變數。 您可以選擇任何可預測的屬性數據行,以拖曳到此文字框。
按兩下 [ 切換至查詢結果檢視] 按鈕,位於預測查詢產生器右上角。
預期的結果包含給定這些輸入條件下每個服務等級的可能預測值,以及每個預測的支援值和機率值。 您可以隨時返回設計檢視並變更輸入,或新增更多輸入。
使用羅吉斯回歸模型建立預測
如果您已經知道與商務問題相關的屬性,您可以使用羅吉斯回歸模型來預測某些屬性進行變更的效果。 羅吉斯回歸是一種統計方法,通常用來根據獨立變數的變更進行預測:例如,用於財務評分,以根據客戶人口統計預測客戶行為。
在這項工作中,您將瞭解如何建立將用於預測的數據源,然後進行預測以協助回答數個商務問題。
產生用於大量預測的數據
有許多方法可提供輸入數據:例如,您可能會從電子表格匯入人員配置層級,並透過模型執行該數據,以預測下個月的服務品質。
在這一課,您將使用數據源檢視設計工具來建立具名查詢。 這個具名查詢是自定義的 Transact-SQL 語句,排程上每個班次都會計算工作人員的運算子數目上限、收到的最小呼叫數,以及產生的平均問題數目。 接著,您會將數據聯結至資料探勘模型,以預測一系列未來的日期。
用於生成批量預測查詢的輸入資料
在 [方案總管] 中,以滑鼠右鍵按兩下 [數據源檢視],然後選取 [ 新增數據源檢視]。
在 [數據源檢視精靈] 中,選取 [Adventure Works DW 多維度 2012] 作為數據源,然後按 [ 下一步]。
在 [ 選取數據表和檢視 ] 頁面上,按 [ 下一步 ],而不選取任何數據表。
在 [完成嚮導] 頁面上,輸入名稱
Shifts。此名稱會顯示在 [方案總管] 中,做為數據源檢視的名稱。
以滑鼠右鍵按下空白設計窗格,然後選取 [ 新增具名查詢]。
在 [ 建立具名查詢 ] 對話框中,針對 [名稱] 輸入
Shifts for Call Center。此名稱只會以具名查詢的名稱顯示於數據源檢視設計工具中。
將下列查詢語句貼到對話框下半部的 [SQL 文字] 窗格中。
SELECT DISTINCT WageType, Shift, AVG(Orders) as AvgOrders, MIN(Orders) as MinOrders, MAX(Orders) as MaxOrders, AVG(Calls) as AvgCalls, MIN(Calls) as MinCalls, MAX(Calls) as MaxCalls, AVG(LevelTwoOperators) as AvgOperators, MIN(LevelTwoOperators) as MinOperators, MAX(LevelTwoOperators) as MaxOperators, AVG(IssuesRaised) as AvgIssues, MIN(IssuesRaised) as MinIssues, MAX(IssuesRaised) as MaxIssues FROM dbo.FactCallCenter GROUP BY Shift, WageType在設計窗格中,以滑鼠右鍵按一下表格「呼叫中心的班次」,然後選取「檢視數據」,以預覽 T-SQL 查詢所傳回的數據。
以滑鼠右鍵按兩下索引標籤 Shifts.dsv (設計), 然後按兩下 [ 儲存 ] 以儲存新的資料源檢視定義。
預測每個班次的服務指標
既然您已為每個班次產生一些值,您將使用這些值作為您所建置羅吉斯回歸模型的輸入,以產生一些可用於商務規劃的預測。
若要使用新的 DSV 作為預測查詢的輸入
在 [數據採礦設計師] 中,按兩下 [ 採礦模型預測 ] 索引標籤。
在 [ 採礦模型] 窗格中,按兩下 [ 選取模型],然後從可用的模型清單中選擇 [通話中心 - LR]。
從 [ 採礦模型] 功能表中,清除 [ 單一查詢] 選項。 警告會告訴您單一查詢輸入將會遺失。 按一下 [確定]。
[單一查詢輸入] 對話方塊會取代為 [選取輸入資料表] 對話方塊。
按兩下 [選取案例數據表]。
在 [ 選取數據表] 對話框中,從數據源清單中選取 [Shifts]。 在 [ 數據表/檢視名稱] 清單中,選取 [通話中心班次] (可能會自動選取),然後按兩下 [ 確定]。
採礦模型預測設計區域會更新,以顯示根據輸入數據及模型中資料欄的名稱和資料類型所建立的映射。
以滑鼠右鍵按兩下其中一個聯結行,然後選取[ 修改連線]。
在此對話框中,您可以清楚地看到哪些欄位已對應,哪些未對應。 資料探勘模型包含呼叫、訂單、已提出問題和二級操作員的數據列,您可以將其對應到根據源數據中這些數據列所建立的任何匯總。 在此情境中,您將對應到平均值。
點選 LevelTwoOperators 旁的空白儲存格,然後選取 Shifts for Call Center.AvgOperators。
單擊 [通話] 旁的空白單元格,選取 [通話中心.AvgCalls] 的 Shifts。 然後按一下 [確定] 。
創建每個班次的預測
在預測查詢產生器的下半部方格中,按一下Source底下的空白儲存格,然後選取「通話中心班次」。
在 [ 欄位] 底下的空白儲存格中,選取 [Shift]。
單擊方格中的下一個空白行,然後重複上述程式,為 WageType 新增另一個數據列。
點擊網格中的下一行空白行。 在 [ 來源] 數據行中,選取 [ 預測函式]。 在 欄位 欄中,選取 預測。
將「採礦模型」窗格中的欄 [ServiceGrade] 拖曳到網格,並放入「Criteria/Argument」格式格。 在 [ 別名] 字段中,輸入 Predicted Service Grade。
點擊網格中的下一個空白行。 在 [ 來源] 數據行中,選取 [ 預測函式]。 在 欄 中,選取 PredictProbability。
將 [採礦模型] 窗格中的欄位 [ServiceGrade] 向下拖曳至網格,再拖曳至 [Criteria/Argument] 儲存格。 在 [ 別名] 欄位中,輸入 Probability。
按切換到查詢結果檢視以檢視預測。
下表顯示每個班次的範例結果。
| 轉變 | 薪資類型 | 預測服務等級 | 概率 |
|---|---|---|---|
| 上午 | 假期 | 0.165 | 0.377520666 |
| 午夜 | 假期 | 0.105 | 0.364105573 |
| PM1 | 假期 | 0.165 | 0.40056055 |
| PM2.5 | 假期 | 0.165 | 0.338532973 |
| 上午 | 工作日 | 0.165 | 0.370847617 |
| 午夜 | 工作日 | 0.08 | 0.352999173 |
| PM1 | 工作日 | 0.165 | 0.317419177 |
| PM2 | 工作日 | 0.105 | 0.311672027 |
預測降低回應時間對服務等級的影響
您為每個班次產生一些平均值,並使用這些值作為羅吉斯回歸模型的輸入。 不過,鑒於商業目標是將放棄率保持在 0.00-0.05 的範圍內,結果並不令人鼓舞。
因此,根據原始模型,顯示回應時間對服務等級的強烈影響,Operations 小組決定執行一些預測,以評估是否降低回應呼叫的平均時間可能會改善服務品質。 例如,如果您將通話回應時間縮短為90%,甚至縮短為目前通話回應時間的80%,服務等級值會發生什麼事?
很容易建立數據源檢視 (DSV),以計算每個班次的平均回應時間,然後新增計算平均響應時間 80% 或 90% 的數據行。 然後,您可以使用 DSV 作為模型的輸入。
雖然此處未顯示確切的步驟,但下表比較當您將回應時間減少為 80% 或目前回應時間的 90% 時,服務等級的影響。
從這些結果中,您可能會得出結論,在目標班次上,您應該將響應時間減少到目前時間的90%,以改善服務品質。
| 班次、工資和日期 | 根據目前平均回應時間的預測服務品質 | 回應時間減少 90% 的情況下的預期服務品質 | 回應時間減少 80% 的預測服務品質 |
|---|---|---|---|
| 假日上午 | 0.165 | 0.05 | 0.05 |
| 假日 PM1 | 0.05 | 0.05 | 0.05 |
| 假日午夜 | 0.165 | 0.05 | 0.05 |
您可以在此模型上建立各種不同的其他預測查詢。 例如,您可以預測需要多少運算元才能符合特定服務等級,或回應特定數目的來電。 由於您可以在羅吉斯回歸模型中包含多個輸出,因此您可以輕鬆地試驗不同的獨立變數和結果,而不需要建立許多個別的模型。
備註
適用於 Excel 2007 的數據採礦 Add-Ins 提供羅吉斯回歸精靈,可讓您輕鬆地回答複雜的問題,例如需要多少層級二級運算元,才能將服務等級提升為特定班次的目標層級。 數據採礦增益集是免費下載的,並包含以類神經網路或羅吉斯迴歸演算法為基礎的精靈。 如需詳細資訊,請前往下面連結:
適用於 Office 2007 的 SQL Server 2008 數據採礦 Add-Ins:目標搜尋案例分析、假設案例分析和預測計算機
結論
您已瞭解如何建立、自定義及解譯以 Microsoft類神經網路演算法和Microsoft羅吉斯回歸演算法為基礎的採礦模型。 這些模型類型很複雜,而且在分析中允許幾乎無限的多樣性,因此可能很複雜且難以掌握。
不過,這些演算法可以逐一檢查多種因素組合,並自動識別最強的關聯性,為可能無法通過手動數據探索甚至使用 Transact-SQL 或 PowerPivot 所發現的見解提供統計支持。