コール センター モデルの検証 (中級者向けデータ マイニング チュートリアル)
調査モデルを構築したら、それを使用して、データについてより深く考察することができます。具体的には、Business Intelligence Development Studio に備わっている次のツールを使用します。
Microsoft ニューラル ネットワーク ビューアー : このビューアーは、データ マイニング デザイナーの [マイニング モデル ビューアー] タブから利用でき、データに含まれるさまざまな相互関係を考察できるように設計されています。
Microsoft 汎用コンテンツ ツリー ビューアー : モデルの生成時にアルゴリズムによって検出されたパターンおよび統計に関する詳細を提供する標準的なビューアーです。
データ ソース ビュー デザイナー : ソース データの調査に役立てることのできるテーブル、グラフ、ピボット グラフ、およびピボット テーブルを備えたビューアーです。ソース データに立ち返ることは、モデルが表す傾向を理解するうえで非常に効果的な手段です。
Microsoft ニューラル ネットワーク ビューアー
ビューアーには、[入力]、[出力]、および [変数] の 3 つのペインがあります。
[出力] ペインを使用することにより、予測可能な属性または従属変数に各種の値を選択できます。モデルに複数の予測可能な属性が存在する場合は、[出力属性] リストから属性を選択できます。
[変数] ペインには、寄与している属性 (変数) という観点で選択した 2 つの結果の比較が表示されます。色分けされたバーは、対象となる結果に対し、変数がどの程度強く影響を与えているかを視覚的に表します。変数のリフト スコアを表示することもできます。リフト スコアは、使用しているマイニング モデルの種類によって計算方法が異なりますが、一般には、予測にこの属性を使用した場合のモデルの改善状況を示します。
[入力] ペインでは、モデルにインフルエンサを追加することによって、さまざまな what-if (シナリオ) 分析を試行できます。
[出力] ペインの使用
この初期モデルでは、サービスのグレードに対して各種の要因がどのように影響を及ぼしているかを調べます。そのためには、出力属性のリストからサービス グレードを選択し、[値 1] および [値 2] のドロップダウン リストから範囲を選択することによって、異なるサービス レベルを比較します。
最低と最高のサービス グレードを比較するには
[値 1] で、最低の値を含む範囲を選択します。たとえば、0 ~ 0.07 の範囲は、最低の電話放棄呼率 (つまり、最高のサービス水準) を表します。
注 この範囲に含まれる厳密な値は、モデルの構成方法によって異なる場合があります。
[値 2] で、最高の値を含む範囲を選択します。たとえば、値が >=0.12 の範囲は、最高の電話放棄呼率 (つまり、最も悪いサービス グレード) を表します。つまり、このシフト中に電話をかけてきた顧客の 12% が、担当者が応対する前に電話を切ったことになります。
[変数] ペインの内容が更新され、結果の値に寄与している属性が対比されます。左側の列は、最高グレードのサービスに関連付けられている属性を表し、右側の列は、最低グレードのサービスに関連付けられている属性を表します。
[変数] ペインの使用
このモデルでは、[案件あたりの平均時間] が重要な要因です。この変数は、問い合わせの種類に関係なく、問い合わせから回答までに要した平均時間を示します。
属性の確率スコアとリフト スコアを表示およびコピーするには
[変数] ペインで、先頭行の色分けされたバーの上にマウスを合わせます。
この色分けされたバーは、[AverageTimePerIssue] がサービスのグレードに対し、どの程度寄与しているかを示すものです。ツールヒントには、変数と対象となる結果の組み合わせごとに、全体的なスコア、確率、およびリフト スコアが表示されます。
[変数] ペインで、色分けされたバーを右クリックし、[コピー] を選択します。
Excel ワークシートで、任意のセルを右クリックし、[貼り付け] を選択します。
レポートが HTML テーブルとして貼り付けられ、各バーのスコアだけが表示されます。
別の Excel ワークシートで、任意のセルを右クリックし、[形式を選択して貼り付け] を選択します。
レポートがテキスト形式で貼り付けられ、関連する統計 (次のセクションで説明) が表示されます。
[入力] ペインの使用
シフトやオペレーターの人数など、特定の要因の影響を調べているとします。[入力] ペインを使用して特定の変数を選択すると、[変数] ペインが自動的に更新され、指定された変数に基づいて、直前に選択された 2 つのグループの比較結果が表示されます。
入力属性を変更することによってサービス グレードへの影響をレビューするには
[入力] ペインで、[属性] に [シフト] を選択します。
[値] に AM を選択します。
[変数] ペインが更新されて、シフトを AM にした場合のモデルへの影響が表示されます。それ以外のすべての選択内容は変わりません。引き続き、最低と最高のサービス グレードが対比されます。
[値] に PM1 を選択します。
[変数] ペインが更新されて、シフトを変更した場合のモデルへの影響が表示されます。
[入力] ペインで、[属性] から次の空白行をクリックし、[問い合わせ] を選択します。[値] で、問い合わせの最大件数を示す範囲を選択します。
リストに新しい入力条件が追加されます。[変数] ペインが更新され、特定のシフトについて、問い合わせ件数が最大の場合のモデルへの影響が表示されます。
[シフト] および [問い合わせ] の値を変更しながら、シフト、問い合わせ件数、およびサービス グレードの間に、何か相関関係がないか見極めます。
注 [入力] ペインをクリアして他の属性を使用できるようにするには、[ビューアーのコンテンツを最新状態に更新] をクリックします。
ビューアーに表示される統計の解釈
待ち時間が長ければ、電話放棄呼率が高くなり、サービス グレードも低下します。当然の結果のようにも見えますが、マイニング モデルは、その傾向を読み解くための補足的な統計データをいくつか提供します。
スコア : ある結果と別の結果との差異を見分けるときに、この変数の全体的な重要度を示す値。スコアが高いほど、その変数が結果に及ぼす影響は強くなります。
値 1 の確率 : 結果に対する値の確率を表すパーセンテージ。
値 2 の確率 : 結果に対する値の確率を表すパーセンテージ。
値 1 のリフト/値 2 のリフト : 値 1 と値 2 の結果を予測する際に、この特定の変数を使用することの影響を表すスコア。スコアが高いほど、その変数を使って、効果的に結果を予測することができます。
次の表に、トップ インフルエンサについて、いくつかの値の例を示します。たとえば、値 1 の確率は 60.6% で、値 2 の確率は 8.30% です。つまり、案件あたりの平均時間が 44 ~ 70 分の範囲にある場合、サポート案件の 60.6% は、最高のサービス グレード (値 1) のシフトに存在し、サポート案件の 8.30% は最低のサービス グレード (値 2) のシフトに存在することになります。
この情報からは、いくつかの結論を導き出すことができます。問い合わせ応対時間が短いことは (44 ~ 70 の範囲)、サービス グレードの向上に強く影響しています (0.00 ~ 0.07 の範囲)。スコア (92.35) からも、この変数が非常に重要であることがわかります。
ただし、要因リストの下の方に目を向けると、影響が微弱で解釈が難しいその他の要因がいくつか確認できます。たとえば、シフトは一見、サービスに影響を及ぼすように見えますが、リフト スコアおよび相対的確率を見る限り、シフトはさほど大きな要因ではありません。
属性 |
値 |
水準 < 0.07 |
水準 >= 0.12 |
---|---|---|---|
案件あたりの平均時間 |
89.087 - 120.000 |
|
スコア : 100
値 1 の確率 : 4.45 %
値 2 の確率 : 51.94 %
値 1 のリフト : 0.19
値 2 のリフト : 1.94
|
案件あたりの平均時間 |
44.000 - 70.597 |
スコア : 92.35
値 1 の確率 : 60.06 %
値 2 の確率 : 8.30 %
値 1 のリフト : 2.61
値 2 のリフト : 0.31
|
|
トップに戻る
Microsoft 汎用コンテンツ ツリー ビューアー
このビューアーを使用すると、モデルの処理時にアルゴリズムによって作成された、さらに詳しい情報を閲覧できます。Microsoft 汎用コンテンツ ツリー ビューアーはマイニング モデルを一連のノードで表します。各ノードは、トレーニング データに関する学習済みの知識を表します。このビューアーは、あらゆるモデルで使用できますが、ノードの内容はモデルの種類によって異なります。
ニューラル ネットワーク モデルまたはロジスティック回帰モデルの場合、特に重要なのは marginal statistics node です。このノードには、データに含まれる値の分布に関して得られた統計が表示されます。この情報は、多数の T-SQL クエリを作成せずにデータの概要を取得する必要がある場合に、役立てることができます。前のトピックで、ビン分割値のグラフを取り上げましたが、このグラフは、マージナル統計ノードから導かれたものです。
マイニング モデルからデータ値の概要を取得するには
データ マイニング デザイナーの [マイニング モデル ビューアー] タブで、<マイニング モデル名> を選択します。
[ビューアー] ボックスの一覧で [Microsoft 汎用コンテンツ ツリー ビューアー] をクリックします。
マイニング モデルのビューが更新されて、左側のペインにノード階層が、右側のペインに HTML テーブルが表示されます。
[ノードのキャプション] ペインで、10000000000000000 という名前のノードをクリックします。
どのモデルにも言えることですが、最上位のノードは常に、そのモデルのルート ノードです。ニューラル ネットワーク モデルまたはロジスティック回帰モデルでは、その直下のノードがマージナル統計ノードです。
[ノードの詳細] ペインを下にスクロールしながら、NODE_DISTRIBUTION という行を探します。
NODE_DISTRIBUTION テーブルを下にスクロールして、ニューラル ネットワークのアルゴリズムによって計算された値の分布を表示します。
このデータをレポートに使用するには、特定の行の情報を選択してコピーします。または、次のデータ マイニング拡張機能 (DMX) クエリを使用して、ノードの完全な内容を抽出することもできます。
SELECT *
FROM [Call Center EQ4].CONTENT
WHERE NODE_NAME = '10000000000000000'
ノード階層と、NODE_DISTRIBUTION テーブル内の詳細情報を使用して、ニューラル ネットワーク内のパスを個別にたどり、非表示になっているレイヤーの統計を閲覧することもできます。詳細については、「ニューラル ネットワーク モデルのクエリ (Analysis Services - データ マイニング)」を参照してください。
トップに戻る
データ ソース ビュー デザイナー
このビューアーは、主にマイニング構造やキューブを構築するときに使用されます。ただし、ソース データをより深く理解するためのツールもひととおり備えています。たとえば、よく理解できない傾向がモデルで見つかった場合に、基になるデータで個々の行を確認したり、相関関係を理解するための概要やグラフを作成したりできます。
このセクションでは、データを Excel にコピーしたり、データ ソースに対して何度も T-SQL クエリを実行したりすることなく、データ ソース ビュー デザイナーを使用して、モデルが示す傾向を調査する方法を、1 つの例を通じて説明します。
このシナリオでは、モデルによって検出された応対時間とサービス グレード間の相関関係をグラフィカルに示す、いくつかのグラフを作成します。
マイニング モデルから傾向を示すピボット グラフを作成するには
ソリューション エクスプローラーで、[データ ソース ビュー] の [Call Center.dsv] をダブルクリックします。
[Call Center.dsv] タブで、FactCallCenter テーブルを右クリックし、[データの探索] を選択します。
[FactCallCenter テーブルの探索] というタイトルの新しいタブが開きます。このタブは、[テーブル] タブ、[ピボット テーブル] タブ、[グラフ] タブ、[ピボット グラフ] タブの 4 つのセクションで構成されています。
[ピボット グラフ] タブをクリックします。
[グラフのフィールド リスト] で [AverageTimePerIssue] を選択し、それをグラフ領域の [ここにカテゴリ フィールドをドロップします] と書かれたボックスにドラッグします。
ソース データはフラット テーブルから取得されているため、[グラフのフィールド リスト] の階層には、階層レベルおよびフィールド レベルにあるものと同じ情報が表示されます。ただし、キューブまたはディメンションを使用している場合、階層に、複数のメンバーが含まれることがあります。たとえば、日付階層に、四半期、月、日といったフィールドが含まれる場合もあります。グラフには、階層全体をドラッグすることも、特定の階層の単一のメンバーをドラッグすることもできます。
[グラフのフィールド リスト] で [ServiceGrade] を探し、それをグラフ領域の中央にドラッグします。
グラフが更新され、その上部に [ServiceGrade の合計] というタイトルのボックスが追加されます。
ツール バーで、シグマ アイコンをクリックし、[平均] を選択します。
タイトルが [ServiceGrade の平均] に更新されます。
[グラフのフィールド リスト] でシフトを選択し、それをグラフ領域の [ここにフィルターを設定するフィールドをドロップします] と書かれたボックスにドラッグします。[グラフのフィールド リスト] から WageType をドラッグし、シフトの横にドロップします。
これで、シフトをフィルター条件とし、シフトによって傾向に何か変化が生じるかどうかを確認したり、その日が祝日か平日かを調べたりすることができます。
グラフの一番下にある [AverageTimePerIssue] を選択し、再度、[グラフのフィールド リスト] にドラッグします。
[グラフのフィールド リスト] で [AverageTimePerLevelTwoOperators] を選択し、それをグラフ領域の [ここにカテゴリ フィールドをドロップします] と書かれたボックスにドラッグします。
グラフが更新され、オペレーターの増員と平均サービス グレードとの間の相関関係が表示されます。線形関係はなさそうです。新しいフィールドをグラフにドロップするか、グラフの種類を変更することによって、引き続き調査を行うことができます。
ただし、通常、これらのグラフで一度に表示できる属性はほんのわずかです。一方、ニューラル ネットワークのアルゴリズムでは、複数の入力が関係する複雑な相互関係が分析されます。また、ニューラル ネットワーク モデルでは、微弱すぎてグラフで表現できないような、さまざまな相関関係が検出されます。
Visio 用データ マイニング テンプレートを使用すれば、図をエクスポートしたり、複雑なニューラル ネットワーク モデルのプレゼンテーションを作成したりすることができます。これは、Visio 2007 用に無償で提供されているアドインです。データ マイニング モデルの精巧な図を作成することが可能です。この図をカスタマイズすることによって、プレゼンテーションやレポートに使用することができます。詳細については、「Office 2007 用データ マイニング アドイン」を参照してください。
トップに戻る