共用方式為


加入用於撥接中心資料的資料來源檢視 (中繼資料採礦教學課程)

在這項工作中,您將加入資料來源檢視,用來存取撥接中心資料。 相同的資料將用於建立用來進行探索的初步類神經網路模型,以及用於提出建議的羅吉斯迴歸模型。

您也將會使用資料來源檢視設計工具,為週中的日加入一個資料行。 因為雖然來源資料依日期追蹤撥接中心的資料,但是您根據經驗得知,依據當天是工作日或週末,在通話量和服務品質方面有重複的模式。

程序

若要加入資料來源檢視

  1. [方案總管] 中,以滑鼠右鍵按一下 [資料來源檢視],再選取 [新增資料來源檢視]

    此時會開啟資料來源檢視精靈。

  2. [歡迎使用資料來源檢視精靈] 頁面上,按 [下一步]

  3. [選取資料來源] 頁面上,選取 [關聯式資料來源] 底下的 Adventure Works DW Multidimensional 2012 資料來源。 如果您沒有此資料來源,請參閱<資料採礦基本教學課程>。 按 [下一步]

  4. [選取資料表和檢視] 頁面上,選取下列資料表,再按一下向右箭頭,將該資料表加入資料來源檢視中:

    • FactCallCenter (dbo)

    • DimDate

  5. [下一步]

  6. [正在完成精靈] 頁面上,資料來源檢視依預設是命名為 Adventure Works DW Multidimensional 2012 。 將名稱變更為 CallCenter,然後按一下 [完成]

    資料來源檢視設計工具隨即開啟,其中顯示 CallCenter 資料來源檢視。

  7. 在 [資料來源檢視] 窗格內按一下滑鼠右鍵,然後選取 [加入/移除資料表]。 選取 DimDate 資料表,再按一下 [確定]

    每份資料表中的 DateKey 資料行之間應該會自動建立關聯性。 您將使用此關聯性,從 DimDate 資料表取得 EnglishDayNameOfWeek 資料行,並將它用於模型中。

  8. 在 [資料來源檢視] 設計工具中,以滑鼠右鍵按一下 FactCallCenter 資料表,然後選取 [新增具名計算]

    [建立具名計算] 對話方塊中,輸入下列值:

    資料行名稱

    DayOfWeek

    說明

    從 DimDate 資料表取得週中的日

    運算式

    (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    若要確認運算式建立所需資料,以滑鼠右鍵按一下 FactCallCenter 資料表,然後選取 [瀏覽資料]

  9. 花一分鐘檢閱可用的資料,以便了解資料在資料採礦中的用法:

資料行名稱

包含

FactCallCenterID

當資料匯入資料倉儲時建立的任意索引鍵。

此資料行會識別唯一記錄,應該做為資料採礦模型的案例索引鍵。

DateKey

撥接中心作業的日期,以整數表示。 資料倉儲中通常使用整數日期索引鍵,但是如果您要依日期值進行分組,可能想要取得日期/時間格式的日期。

請注意,日期不是唯一的,因為廠商會在作業的每一天,為每個排班提供一個個別的報表。

WageType

表示該日期為工作日、週末或假日。

工作日與週末的客戶服務品質可能有差異, 因此您將使用此資料行做為輸入。

Shift

表示記錄電話當時的排班。 此撥接中心將工作日分成四個排班:AM、PM1、PM2,以及 Midnight。

排班可能對客戶服務品質造成影響,因此您將它做為輸入。

LevelOneOperators

表示待命的一級操作員數目。

撥接中心員工從一級開始,因此這些員工資歷較淺。

LevelTwoOperators

表示待命的二級操作員數目。

員工必須記錄特定的服務時數才能限定為二級操作員。

TotalOperators

排班期間出現的操作員總數。

Calls

排班期間接到的電話通數。

AutomaticResponses

完全由自動化電話處理 (互動式語音應答,也就是 IVR) 所處理的電話通數。

Orders

來自電話的訂單數目。

IssuesRaised

由電話產生、需要後續追蹤的問題數目。

AverageTimePerIssue

回應來電所需的平均時間。

ServiceGrade

表示一般服務品質的標準,以整個排班的「放棄率」(Abandon Rate) 表示。 放棄率越高,客戶越可能不滿意,而且可能會遺失潛在的訂單。

請注意,資料包含以單一日期資料行為基礎的四個不同的資料行:WageTypeDayOfWeekShiftDateKey。 通常在資料採礦中,最好不要使用多個衍生自相同資料的資料行,因為值的相互關聯性太強,可能會遮蔽其他模式。

但是,因為 DateKey 包含太多唯一值,我們不會在模型中使用它。 ShiftDayOfWeek 之間沒有直接關聯性,而且 WageTypeDayOfWeek 只是部分相關。 如果您對共線性有顧慮,可以使用所有可用的資料行建立結構,然後忽略各模型中不同的資料行並測試效果。

本課程的下一項工作

建立類神經網路結構和模型 (中繼資料採礦教學課程)

請參閱

概念

多維度模型中的資料來源檢視