在這項工作中,您將加入資料來源檢視,用來存取撥接中心資料。 相同的資料將用於建立用來進行探索的初步類神經網路模型,以及用於提出建議的羅吉斯迴歸模型。
您也將會使用資料來源檢視設計工具,為週中的日加入一個資料行。 因為雖然來源資料依日期追蹤撥接中心的資料,但是您根據經驗得知,依據當天是工作日或週末,在通話量和服務品質方面有重複的模式。
程序
若要加入資料來源檢視
在 [方案總管] 中,以滑鼠右鍵按一下 [資料來源檢視],再選取 [新增資料來源檢視]。
此時會開啟資料來源檢視精靈。
在 [歡迎使用資料來源檢視精靈] 頁面上,按 [下一步]。
在 [選取資料來源] 頁面上,選取 [關聯式資料來源] 底下的 Adventure Works DW Multidimensional 2012 資料來源。 如果您沒有此資料來源,請參閱<資料採礦基本教學課程>。 按 [下一步]。
在 [選取資料表和檢視] 頁面上,選取下列資料表,再按一下向右箭頭,將該資料表加入資料來源檢視中:
FactCallCenter (dbo)
DimDate
按 [下一步]。
在 [正在完成精靈] 頁面上,資料來源檢視依預設是命名為 Adventure Works DW Multidimensional 2012 。 將名稱變更為 CallCenter,然後按一下 [完成]。
資料來源檢視設計工具隨即開啟,其中顯示 CallCenter 資料來源檢視。
在 [資料來源檢視] 窗格內按一下滑鼠右鍵,然後選取 [加入/移除資料表]。 選取 DimDate 資料表,再按一下 [確定]。
每份資料表中的 DateKey 資料行之間應該會自動建立關聯性。 您將使用此關聯性,從 DimDate 資料表取得 EnglishDayNameOfWeek 資料行,並將它用於模型中。
在 [資料來源檢視] 設計工具中,以滑鼠右鍵按一下 FactCallCenter 資料表,然後選取 [新增具名計算]。
在 [建立具名計算] 對話方塊中,輸入下列值:
資料行名稱
DayOfWeek
說明
從 DimDate 資料表取得週中的日
運算式
(SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)
若要確認運算式建立所需資料,以滑鼠右鍵按一下 FactCallCenter 資料表,然後選取 [瀏覽資料]。
花一分鐘檢閱可用的資料,以便了解資料在資料採礦中的用法:
資料行名稱 |
包含 |
|---|---|
FactCallCenterID |
當資料匯入資料倉儲時建立的任意索引鍵。 此資料行會識別唯一記錄,應該做為資料採礦模型的案例索引鍵。 |
DateKey |
撥接中心作業的日期,以整數表示。 資料倉儲中通常使用整數日期索引鍵,但是如果您要依日期值進行分組,可能想要取得日期/時間格式的日期。 請注意,日期不是唯一的,因為廠商會在作業的每一天,為每個排班提供一個個別的報表。 |
WageType |
表示該日期為工作日、週末或假日。 工作日與週末的客戶服務品質可能有差異, 因此您將使用此資料行做為輸入。 |
Shift |
表示記錄電話當時的排班。 此撥接中心將工作日分成四個排班:AM、PM1、PM2,以及 Midnight。 排班可能對客戶服務品質造成影響,因此您將它做為輸入。 |
LevelOneOperators |
表示待命的一級操作員數目。 撥接中心員工從一級開始,因此這些員工資歷較淺。 |
LevelTwoOperators |
表示待命的二級操作員數目。 員工必須記錄特定的服務時數才能限定為二級操作員。 |
TotalOperators |
排班期間出現的操作員總數。 |
Calls |
排班期間接到的電話通數。 |
AutomaticResponses |
完全由自動化電話處理 (互動式語音應答,也就是 IVR) 所處理的電話通數。 |
Orders |
來自電話的訂單數目。 |
IssuesRaised |
由電話產生、需要後續追蹤的問題數目。 |
AverageTimePerIssue |
回應來電所需的平均時間。 |
ServiceGrade |
表示一般服務品質的標準,以整個排班的「放棄率」(Abandon Rate) 表示。 放棄率越高,客戶越可能不滿意,而且可能會遺失潛在的訂單。 |
請注意,資料包含以單一日期資料行為基礎的四個不同的資料行:WageType、DayOfWeek、Shift 和 DateKey。 通常在資料採礦中,最好不要使用多個衍生自相同資料的資料行,因為值的相互關聯性太強,可能會遮蔽其他模式。
但是,因為 DateKey 包含太多唯一值,我們不會在模型中使用它。 Shift 和 DayOfWeek 之間沒有直接關聯性,而且 WageType 和 DayOfWeek 只是部分相關。 如果您對共線性有顧慮,可以使用所有可用的資料行建立結構,然後忽略各模型中不同的資料行並測試效果。