このタスクでは、コール センター データへのアクセスに使用するデータ ソース ビューを追加します。 同じデータを使用して、探索用の初期ニューラル ネットワーク モデルと、推奨事項を作成するために使用するロジスティック回帰モデルの両方を構築します。
また、データ ソース ビュー デザイナーを使用して、曜日の列を追加します。 これは、ソース データは日付によってコール センターデータを追跡しますが、その日が週末か平日かに応じて、通話量とサービス品質の両方に関して定期的なパターンがあることを示すからです。
プロシージャ
データ ソース ビューを追加するには
ソリューション エクスプローラーで、[データ ソース ビュー] を右クリックし、[新しいデータ ソース ビュー] を選択します。
データ ソース ビュー ウィザードが開きます。
[ データ ソース ビュー ウィザードへようこそ] ページで、[ 次へ] をクリックします。
[ データ ソースの選択 ] ページの [ リレーショナル データ ソース] で、Adventure Works DW 多次元 2012 データ ソースを選択します。 このデータ ソースがない場合は、「 基本的なデータ マイニング チュートリアル」を参照してください。 [次へ] をクリックします。
[ テーブルとビューの選択 ] ページで、次の表を選択し、右矢印をクリックしてデータ ソース ビューに追加します。
FactCallCenter (dbo)
DimDate
[次へ] をクリックします。
[ ウィザードの完了 ] ページの既定では、データ ソース ビューの名前は Adventure Works DW 多次元 2012 です。 名前を CallCenter に変更し、[ 完了] をクリックします。
データ ソース ビュー デザイナーが開き、 CallCenter データ ソース ビューが表示されます。
[データ ソース ビュー] ペイン内を右クリックし、[ テーブルの追加と削除] を選択します。 テーブル DimDate を選択し、[ OK] をクリックします。
各テーブルの
DateKey列間にリレーションシップを自動的に追加する必要があります。 このリレーションシップを使用して、DimDate テーブルから列 EnglishDayNameOfWeek を取得し、モデルで使用します。データ ソース ビュー デザイナーで、テーブル FactCallCenter を右クリックし、[ 新しい名前付き計算] を選択します。
[ 名前付き計算の作成 ] ダイアログ ボックスで、次の値を入力します。
列名 DayOfWeek 説明 DimDate テーブルから曜日を取得する 表現 (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)式によって必要なデータが作成されることを確認するには、 FactCallCenter テーブルを右クリックし、[ データの探索] を選択します。
データ マイニングでの使用方法を理解できるように、使用可能なデータを確認するには少し時間がかかります。
| 列名 | 次のものを含む |
|---|---|
| FactCallCenterID | データがデータ ウェアハウスにインポートされたときに作成された任意のキー。 この列は一意のレコードを識別し、データ マイニング モデルのケース キーとして使用する必要があります。 |
| 日付キー | コール センター操作の日付。整数で表されます。 整数型の日付キーはデータ ウェアハウスでよく使用されますが、日付値でグループ化する場合は日付/時刻形式で日付を取得できます。 日付は一意ではないことに注意してください。仕入先は、稼働日ごとにシフトごとに個別のレポートを提供するためです。 |
| 賃金タイプ | 曜日が平日、週末、または休日のどちらであったかを示します。 週末と平日の顧客サービスの品質に違いがある可能性があるため、この列を入力として使用します。 |
| シフト | 呼び出しが記録されるシフトを示します。 このコール センターは、稼働日を AM、PM1、PM2、および深夜の 4 つのシフトに分割します。 シフトが顧客サービスの品質に影響を与える可能性があるため、これを入力として使用します。 |
| LevelOneOperators | 職務上のレベル 1 のオペレーターの数を示します。 コール センターの従業員はレベル 1 から開始されるため、これらの従業員の経験が少なくなります。 |
| レベルツーオペレーターズ | 職務上のレベル 2 のオペレーターの数を示します。 従業員は、レベル 2 オペレーターとして資格を得るために、特定のサービス時間数をログに記録する必要があります。 |
| TotalOperators | シフト中に存在する演算子の合計数。 |
| 通話 | シフト中に受信した呼び出しの数。 |
| AutomaticResponses | 自動通話処理 (対話型音声応答、または IVR) によって完全に処理された通話の数。 |
| 詻 | 呼び出しの結果として発生した注文の数。 |
| 提起された問題 | 呼び出しによって生成されたフォローアップが必要な問題の数。 |
| 1件あたりの平均時間 | 着信通話に応答するために必要な平均時間。 |
| サービスグレード | サービスの一般的な品質を示すメトリック。シフト全体の 破棄率 として測定されます。 破棄率が高いほど、顧客が不満を持ち、潜在的な注文が失われている可能性が高くなります。 |
データには、1 つの日付列 ( WageType、 DayOfWeek、 Shift、 DateKey) に基づく 4 つの異なる列が含まれていることに注意してください。 通常、データ マイニングでは、同じデータから派生した複数の列を使用することはお勧めしません。値が相互に強すぎて、他のパターンを隠す可能性があるためです。
ただし、一意の値が多すぎるため、モデルでは DateKey を使用しません。
Shiftと DayOfWeek の間には直接的な関係はなく、WageTypeと DayOfWeek は部分的にのみ関連しています。 共線性が心配な場合は、使用可能なすべての列を使用して構造を作成し、各モデルの異なる列を無視して効果をテストできます。
このレッスンの次の作業
ニューラル ネットワーク構造とモデルの作成 (中間データ マイニング チュートリアル)