コールセンターデータのデータソースビューの追加 (中間データマイニングチュートリアル)

このタスクでは、コールセンターデータへのアクセスに使用するデータソースビューを追加します。同じデータを使用して、探索用の初期ニューラルネットワークモデルと、推奨事項を作成するために使用するロジスティック回帰モデルの両方を構築します。

また、データソースビューデザイナーを使用して、曜日の列を追加します。これは、ソースデータは日付によってコールセンターデータを追跡しますが、その日が週末か平日かに応じて、通話量とサービス品質の両方に関して定期的なパターンがあることを示すからです。

プロシージャ

データソースビューを追加するには

ソリューションエクスプローラーで、[データソースビュー] を右クリックし、[新しいデータソースビュー] を選択します。

データソースビューウィザードが開きます。
[ データソースビューウィザードへようこそ] ページで、[ 次へ] をクリックします。
[ データソースの選択 ] ページの [ リレーショナルデータソース] で、Adventure Works DW 多次元 2012 データソースを選択します。このデータソースがない場合は、「基本的なデータマイニングチュートリアル」を参照してください。 [次へ] をクリックします。
[ テーブルとビューの選択 ] ページで、次の表を選択し、右矢印をクリックしてデータソースビューに追加します。
- FactCallCenter (dbo)
- DimDate
[次へ] をクリックします。
[ ウィザードの完了 ] ページの既定では、データソースビューの名前は Adventure Works DW 多次元 2012 です。名前を CallCenter に変更し、[ 完了] をクリックします。

データソースビューデザイナーが開き、 CallCenter データソースビューが表示されます。
[データソースビュー] ペイン内を右クリックし、[ テーブルの追加と削除] を選択します。テーブル DimDate を選択し、[ OK] をクリックします。

各テーブルの DateKey 列間にリレーションシップを自動的に追加する必要があります。このリレーションシップを使用して、DimDate テーブルから列 EnglishDayNameOfWeek を取得し、モデルで使用します。

データソースビューデザイナーで、テーブル FactCallCenter を右クリックし、[ 新しい名前付き計算] を選択します。

[ 名前付き計算の作成 ] ダイアログボックスで、次の値を入力します。


列名	DayOfWeek
説明	DimDate テーブルから曜日を取得する
表現	`(SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)`

式によって必要なデータが作成されることを確認するには、 FactCallCenter テーブルを右クリックし、[ データの探索] を選択します。

データマイニングでの使用方法を理解できるように、使用可能なデータを確認するには少し時間がかかります。

列名	次のものを含む
FactCallCenterID	データがデータウェアハウスにインポートされたときに作成された任意のキー。この列は一意のレコードを識別し、データマイニングモデルのケースキーとして使用する必要があります。
日付キー	コールセンター操作の日付。整数で表されます。整数型の日付キーはデータウェアハウスでよく使用されますが、日付値でグループ化する場合は日付/時刻形式で日付を取得できます。日付は一意ではないことに注意してください。仕入先は、稼働日ごとにシフトごとに個別のレポートを提供するためです。
賃金タイプ	曜日が平日、週末、または休日のどちらであったかを示します。週末と平日の顧客サービスの品質に違いがある可能性があるため、この列を入力として使用します。
シフト	呼び出しが記録されるシフトを示します。このコールセンターは、稼働日を AM、PM1、PM2、および深夜の 4 つのシフトに分割します。シフトが顧客サービスの品質に影響を与える可能性があるため、これを入力として使用します。
LevelOneOperators	職務上のレベル 1 のオペレーターの数を示します。コールセンターの従業員はレベル 1 から開始されるため、これらの従業員の経験が少なくなります。
レベルツーオペレーターズ	職務上のレベル 2 のオペレーターの数を示します。従業員は、レベル 2 オペレーターとして資格を得るために、特定のサービス時間数をログに記録する必要があります。
TotalOperators	シフト中に存在する演算子の合計数。
通話	シフト中に受信した呼び出しの数。
AutomaticResponses	自動通話処理 (対話型音声応答、または IVR) によって完全に処理された通話の数。
詻	呼び出しの結果として発生した注文の数。
提起された問題	呼び出しによって生成されたフォローアップが必要な問題の数。
1件あたりの平均時間	着信通話に応答するために必要な平均時間。
サービスグレード	サービスの一般的な品質を示すメトリック。シフト全体の破棄率として測定されます。破棄率が高いほど、顧客が不満を持ち、潜在的な注文が失われている可能性が高くなります。

データには、1 つの日付列 ( WageType、 DayOfWeek、 Shift、 DateKey) に基づく 4 つの異なる列が含まれていることに注意してください。通常、データマイニングでは、同じデータから派生した複数の列を使用することはお勧めしません。値が相互に強すぎて、他のパターンを隠す可能性があるためです。

ただし、一意の値が多すぎるため、モデルでは DateKey を使用しません。 Shiftと DayOfWeek の間には直接的な関係はなく、WageTypeと DayOfWeek は部分的にのみ関連しています。共線性が心配な場合は、使用可能なすべての列を使用して構造を作成し、各モデルの異なる列を無視して効果をテストできます。

このレッスンの次の作業

ニューラルネットワーク構造とモデルの作成 (中間データマイニングチュートリアル)

こちらもご覧ください

多次元モデルのデータソースビュー

Last updated on 2017-12-29

次の方法で共有

コール センター データのデータ ソース ビューの追加 (中間データ マイニング チュートリアル)

プロシージャ

データ ソース ビューを追加するには

このレッスンの次の作業

こちらもご覧ください

その他のリソース

コールセンターデータのデータソースビューの追加 (中間データマイニングチュートリアル)

データソースビューを追加するには