適用於: SQL Server 2016 Preview
在這項工作中,您將加入資料來源檢視,用來存取撥接中心資料。 相同的資料將用於建立用來進行探索的初步類神經網路模型,以及用於提出建議的羅吉斯迴歸模型。
您也將會使用資料來源檢視設計工具,為週中的日加入一個資料行。 因為雖然來源資料依日期追蹤撥接中心的資料,但是您根據經驗得知,依據當天是工作日或週末,在通話量和服務品質方面有重複的模式。
程序
若要加入資料來源檢視
在 方案總管] 中, ,以滑鼠右鍵按一下 資料來源檢視, ,然後選取 新增資料來源檢視。
此時會開啟資料來源檢視精靈。
在 [歡迎使用資料來源檢視精靈] 頁面上,按一下 [下一步]。
在 選取資料來源 ] 頁面的 [ 關聯式資料來源, ,請選取 Adventure Works DW Multidimensional 2012 資料來源。 如果您沒有此資料來源,請參閱 [基本資料採礦教學課程](../Topic/Basic%20Data%20Mining%20Tutorial.md)。 按一下 [下一步]。
在 選取資料表和檢視 頁面上,選取下列資料表,然後按一下 [向右箭號,將它加入至資料來源檢視︰
FactCallCenter (dbo)
DimDate
按一下 [下一步]。
在 正在完成精靈 ] 頁面上,依預設,資料來源檢視命名為 Adventure Works DW Multidimensional 2012。 將名稱變更為 撥接中心, ,然後按一下 [ 完成。
資料來源檢視設計師會開啟並顯示 撥接中心 資料來源檢視。
[資料來源檢視] 窗格內按一下滑鼠右鍵,然後選取 加入/移除資料表。 選取資料表, DimDate 按一下 確定。
關聯性應該之間自動加入 DateKey 每個資料表中的資料行。 您會使用此關聯性來取得資料行, EnglishDayNameOfWeek, ,從 DimDate 資料表,以及使用模型中。
在資料來源檢視設計師中,以滑鼠右鍵按一下資料表, FactCallCenter, ,然後選取 新增具名計算。
在 建立具名計算 對話方塊方塊中,輸入下列值︰
資料行名稱 DayOfWeek 說明 從 DimDate 資料表取得週中的日 運算式 (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)若要確認運算式會建立資料您需要請以滑鼠右鍵按一下資料表 FactCallCenter, ,然後選取 瀏覽資料。
花一分鐘檢閱可用的資料,以便了解資料在資料採礦中的用法:
| 資料行名稱 | 包含 |
|---|---|
| FactCallCenterID | 當資料匯入資料倉儲時建立的任意索引鍵。 此資料行會識別唯一記錄,應該做為資料採礦模型的案例索引鍵。 |
| DateKey | 撥接中心作業的日期,以整數表示。 資料倉儲中通常使用整數日期索引鍵,但是如果您要依日期值進行分組,可能想要取得日期/時間格式的日期。 請注意,日期不是唯一的,因為廠商會在作業的每一天,為每個排班提供一個個別的報表。 |
| WageType | 表示該日期為工作日、週末或假日。 很可能有不同的客戶服務品質工作日與週末,您將使用此資料行做為輸入。 |
| Shift | 表示記錄電話當時的排班。 此撥接中心將工作日分成四個排班:AM、PM1、PM2,以及 Midnight。 排班可能對客戶服務品質造成影響,因此您將它做為輸入。 |
| LevelOneOperators | 表示待命的一級操作員數目。 撥接中心員工從一級開始,因此這些員工資歷較淺。 |
| LevelTwoOperators | 表示待命的二級操作員數目。 員工必須記錄特定的服務時數才能限定為二級操作員。 |
| TotalOperators | 排班期間出現的操作員總數。 |
| Calls | 排班期間接到的電話通數。 |
| AutomaticResponses | 完全由自動化電話處理 (互動式語音應答,也就是 IVR) 所處理的電話通數。 |
| Orders | 來自電話的訂單數目。 |
| IssuesRaised | 由電話產生、需要後續追蹤的問題數目。 |
| AverageTimePerIssue | 回應來電所需的平均時間。 |
| ServiceGrade | 一種度量,表示一般服務品質,以測量 放棄率 整個排班。 放棄率越高,客戶越可能不滿意,而且可能會遺失潛在的訂單。 |
附註的資料包括四個不同的資料行根據單一日期資料行︰ WageType, ,DayOfWeek, ,Shift, ,和 DateKey。 通常在資料採礦中,最好不要使用多個衍生自相同資料的資料行,因為值的相互關聯性太強,可能會遮蔽其他模式。
不過,我們不會使用 DateKey 模型中因為它包含太多唯一值。 之間沒有直接關聯性 Shift 和 DayOfWeek, ,和 WageType 和 DayOfWeek 只部分相關。 如果您對共線性有顧慮,可以使用所有可用的資料行建立結構,然後忽略各模型中不同的資料行並測試效果。
本課程的下一項工作
建立類神經網路結構和模型 #40; 中繼資料採礦教學課程 )