[アーティクル]
04/01/2012

コールセンターモデルの検証 (中級者向けデータマイニングチュートリアル)

調査モデルを構築したら、それを使用して、データについてより深く考察することができます。具体的には、Business Intelligence Development Studio に備わっている次のツールを使用します。

Microsoft ニューラルネットワークビューアー : このビューアーは、データマイニングデザイナーの [マイニングモデルビューアー] タブから利用でき、データに含まれるさまざまな相互関係を考察できるように設計されています。
Microsoft 汎用コンテンツツリービューアー : モデルの生成時にアルゴリズムによって検出されたパターンおよび統計に関する詳細を提供する標準的なビューアーです。
データソースビューデザイナー : ソースデータの調査に役立てることのできるテーブル、グラフ、ピボットグラフ、およびピボットテーブルを備えたビューアーです。ソースデータに立ち返ることは、モデルが表す傾向を理解するうえで非常に効果的な手段です。

Microsoft ニューラルネットワークビューアー

ビューアーには、[入力]、[出力]、および [変数] の 3 つのペインがあります。

[出力] ペインを使用することにより、予測可能な属性または従属変数に各種の値を選択できます。モデルに複数の予測可能な属性が存在する場合は、[出力属性] リストから属性を選択できます。

[変数] ペインには、寄与している属性 (変数) という観点で選択した 2 つの結果の比較が表示されます。色分けされたバーは、対象となる結果に対し、変数がどの程度強く影響を与えているかを視覚的に表します。変数のリフトスコアを表示することもできます。リフトスコアは、使用しているマイニングモデルの種類によって計算方法が異なりますが、一般には、予測にこの属性を使用した場合のモデルの改善状況を示します。

[入力] ペインでは、モデルにインフルエンサを追加することによって、さまざまな what-if (シナリオ) 分析を試行できます。

[出力] ペインの使用

この初期モデルでは、サービスのグレードに対して各種の要因がどのように影響を及ぼしているかを調べます。そのためには、出力属性のリストからサービスグレードを選択し、[値 1] および [値 2] のドロップダウンリストから範囲を選択することによって、異なるサービスレベルを比較します。

最低と最高のサービスグレードを比較するには

[値 1] で、最低の値を含む範囲を選択します。たとえば、0 ～ 0.07 の範囲は、最低の電話放棄呼率 (つまり、最高のサービス水準) を表します。

注

この範囲に含まれる厳密な値は、モデルの構成方法によって異なる場合があります。
[値 2] で、最高の値を含む範囲を選択します。たとえば、値が >=0.12 の範囲は、最高の電話放棄呼率 (つまり、最も悪いサービスグレード) を表します。つまり、このシフト中に電話をかけてきた顧客の 12% が、担当者が応対する前に電話を切ったことになります。

[変数] ペインの内容が更新され、結果の値に寄与している属性が対比されます。左側の列は、最高グレードのサービスに関連付けられている属性を表し、右側の列は、最低グレードのサービスに関連付けられている属性を表します。

注
この範囲に含まれる厳密な値は、モデルの構成方法によって異なる場合があります。

[変数] ペインの使用

このモデルでは、[案件あたりの平均時間] が重要な要因です。この変数は、問い合わせの種類に関係なく、問い合わせから回答までに要した平均時間を示します。

属性の確率スコアとリフトスコアを表示およびコピーするには

[変数] ペインで、先頭行の色分けされたバーの上にマウスを合わせます。

この色分けされたバーは、[AverageTimePerIssue] がサービスのグレードに対し、どの程度寄与しているかを示すものです。ツールヒントには、変数と対象となる結果の組み合わせごとに、全体的なスコア、確率、およびリフトスコアが表示されます。
[変数] ペインで、色分けされたバーを右クリックし、[コピー] を選択します。
Excel ワークシートで、任意のセルを右クリックし、[貼り付け] を選択します。

レポートが HTML テーブルとして貼り付けられ、各バーのスコアだけが表示されます。
別の Excel ワークシートで、任意のセルを右クリックし、[形式を選択して貼り付け] を選択します。

レポートがテキスト形式で貼り付けられ、関連する統計 (次のセクションで説明) が表示されます。

[入力] ペインの使用

シフトやオペレーターの人数など、特定の要因の影響を調べているとします。[入力] ペインを使用して特定の変数を選択すると、[変数] ペインが自動的に更新され、指定された変数に基づいて、直前に選択された 2 つのグループの比較結果が表示されます。

入力属性を変更することによってサービスグレードへの影響をレビューするには

[入力] ペインで、[属性] に [シフト] を選択します。
[値] に AM を選択します。

[変数] ペインが更新されて、シフトを AM にした場合のモデルへの影響が表示されます。それ以外のすべての選択内容は変わりません。引き続き、最低と最高のサービスグレードが対比されます。
[値] に PM1 を選択します。

[変数] ペインが更新されて、シフトを変更した場合のモデルへの影響が表示されます。
[入力] ペインで、[属性] から次の空白行をクリックし、[問い合わせ] を選択します。[値] で、問い合わせの最大件数を示す範囲を選択します。

リストに新しい入力条件が追加されます。[変数] ペインが更新され、特定のシフトについて、問い合わせ件数が最大の場合のモデルへの影響が表示されます。
[シフト] および [問い合わせ] の値を変更しながら、シフト、問い合わせ件数、およびサービスグレードの間に、何か相関関係がないか見極めます。

注

[入力] ペインをクリアして他の属性を使用できるようにするには、[ビューアーのコンテンツを最新状態に更新] をクリックします。

注
[入力] ペインをクリアして他の属性を使用できるようにするには、[ビューアーのコンテンツを最新状態に更新] をクリックします。

ビューアーに表示される統計の解釈

待ち時間が長ければ、電話放棄呼率が高くなり、サービスグレードも低下します。当然の結果のようにも見えますが、マイニングモデルは、その傾向を読み解くための補足的な統計データをいくつか提供します。

スコア : ある結果と別の結果との差異を見分けるときに、この変数の全体的な重要度を示す値。スコアが高いほど、その変数が結果に及ぼす影響は強くなります。
値 1 の確率 : 結果に対する値の確率を表すパーセンテージ。
値 2 の確率 : 結果に対する値の確率を表すパーセンテージ。
値 1 のリフト/値 2 のリフト : 値 1 と値 2 の結果を予測する際に、この特定の変数を使用することの影響を表すスコア。スコアが高いほど、その変数を使って、効果的に結果を予測することができます。

次の表に、トップインフルエンサについて、いくつかの値の例を示します。たとえば、値 1 の確率は 60.6% で、値 2 の確率は 8.30% です。つまり、案件あたりの平均時間が 44 ～ 70 分の範囲にある場合、サポート案件の 60.6% は、最高のサービスグレード (値 1) のシフトに存在し、サポート案件の 8.30% は最低のサービスグレード (値 2) のシフトに存在することになります。

この情報からは、いくつかの結論を導き出すことができます。問い合わせ応対時間が短いことは (44 ～ 70 の範囲)、サービスグレードの向上に強く影響しています (0.00 ～ 0.07 の範囲)。スコア (92.35) からも、この変数が非常に重要であることがわかります。

ただし、要因リストの下の方に目を向けると、影響が微弱で解釈が難しいその他の要因がいくつか確認できます。たとえば、シフトは一見、サービスに影響を及ぼすように見えますが、リフトスコアおよび相対的確率を見る限り、シフトはさほど大きな要因ではありません。

属性	値	水準 < 0.07	水準 >= 0.12
案件あたりの平均時間	89.087 - 120.000		スコア : 100 値 1 の確率 : 4.45 % 値 2 の確率 : 51.94 % 値 1 のリフト : 0.19 値 2 のリフト : 1.94
案件あたりの平均時間	44.000 - 70.597	スコア : 92.35 値 1 の確率 : 60.06 % 値 2 の確率 : 8.30 % 値 1 のリフト : 2.61 値 2 のリフト : 0.31

トップに戻る

Microsoft 汎用コンテンツツリービューアー

このビューアーを使用すると、モデルの処理時にアルゴリズムによって作成された、さらに詳しい情報を閲覧できます。Microsoft 汎用コンテンツツリービューアーはマイニングモデルを一連のノードで表します。各ノードは、トレーニングデータに関する学習済みの知識を表します。このビューアーは、あらゆるモデルで使用できますが、ノードの内容はモデルの種類によって異なります。

ニューラルネットワークモデルまたはロジスティック回帰モデルの場合、特に重要なのは marginal statistics node です。このノードには、データに含まれる値の分布に関して得られた統計が表示されます。この情報は、多数の T-SQL クエリを作成せずにデータの概要を取得する必要がある場合に、役立てることができます。前のトピックで、ビン分割値のグラフを取り上げましたが、このグラフは、マージナル統計ノードから導かれたものです。

マイニングモデルからデータ値の概要を取得するには

データマイニングデザイナーの [マイニングモデルビューアー] タブで、<マイニングモデル名> を選択します。
[ビューアー] ボックスの一覧で [Microsoft 汎用コンテンツツリービューアー] をクリックします。

マイニングモデルのビューが更新されて、左側のペインにノード階層が、右側のペインに HTML テーブルが表示されます。
[ノードのキャプション] ペインで、10000000000000000 という名前のノードをクリックします。

どのモデルにも言えることですが、最上位のノードは常に、そのモデルのルートノードです。ニューラルネットワークモデルまたはロジスティック回帰モデルでは、その直下のノードがマージナル統計ノードです。
[ノードの詳細] ペインを下にスクロールしながら、NODE_DISTRIBUTION という行を探します。
NODE_DISTRIBUTION テーブルを下にスクロールして、ニューラルネットワークのアルゴリズムによって計算された値の分布を表示します。

このデータをレポートに使用するには、特定の行の情報を選択してコピーします。または、次のデータマイニング拡張機能 (DMX) クエリを使用して、ノードの完全な内容を抽出することもできます。

SELECT * 
FROM [Call Center EQ4].CONTENT
WHERE NODE_NAME = '10000000000000000'

ノード階層と、NODE_DISTRIBUTION テーブル内の詳細情報を使用して、ニューラルネットワーク内のパスを個別にたどり、非表示になっているレイヤーの統計を閲覧することもできます。詳細については、「ニューラルネットワークモデルのクエリ (Analysis Services - データマイニング)」を参照してください。

トップに戻る

データソースビューデザイナー

このビューアーは、主にマイニング構造やキューブを構築するときに使用されます。ただし、ソースデータをより深く理解するためのツールもひととおり備えています。たとえば、よく理解できない傾向がモデルで見つかった場合に、基になるデータで個々の行を確認したり、相関関係を理解するための概要やグラフを作成したりできます。

このセクションでは、データを Excel にコピーしたり、データソースに対して何度も T-SQL クエリを実行したりすることなく、データソースビューデザイナーを使用して、モデルが示す傾向を調査する方法を、1 つの例を通じて説明します。

このシナリオでは、モデルによって検出された応対時間とサービスグレード間の相関関係をグラフィカルに示す、いくつかのグラフを作成します。

マイニングモデルから傾向を示すピボットグラフを作成するには

ソリューションエクスプローラーで、[データソースビュー] の [Call Center.dsv] をダブルクリックします。
[Call Center.dsv] タブで、FactCallCenter テーブルを右クリックし、[データの探索] を選択します。

[FactCallCenter テーブルの探索] というタイトルの新しいタブが開きます。このタブは、[テーブル] タブ、[ピボットテーブル] タブ、[グラフ] タブ、[ピボットグラフ] タブの 4 つのセクションで構成されています。
[ピボットグラフ] タブをクリックします。
[グラフのフィールドリスト] で [AverageTimePerIssue] を選択し、それをグラフ領域の [ここにカテゴリフィールドをドロップします] と書かれたボックスにドラッグします。

ソースデータはフラットテーブルから取得されているため、[グラフのフィールドリスト] の階層には、階層レベルおよびフィールドレベルにあるものと同じ情報が表示されます。ただし、キューブまたはディメンションを使用している場合、階層に、複数のメンバーが含まれることがあります。たとえば、日付階層に、四半期、月、日といったフィールドが含まれる場合もあります。グラフには、階層全体をドラッグすることも、特定の階層の単一のメンバーをドラッグすることもできます。
[グラフのフィールドリスト] で [ServiceGrade] を探し、それをグラフ領域の中央にドラッグします。

グラフが更新され、その上部に [ServiceGrade の合計] というタイトルのボックスが追加されます。
ツールバーで、シグマアイコンをクリックし、[平均] を選択します。

タイトルが [ServiceGrade の平均] に更新されます。
[グラフのフィールドリスト] でシフトを選択し、それをグラフ領域の [ここにフィルターを設定するフィールドをドロップします] と書かれたボックスにドラッグします。[グラフのフィールドリスト] から WageType をドラッグし、シフトの横にドロップします。

これで、シフトをフィルター条件とし、シフトによって傾向に何か変化が生じるかどうかを確認したり、その日が祝日か平日かを調べたりすることができます。
グラフの一番下にある [AverageTimePerIssue] を選択し、再度、[グラフのフィールドリスト] にドラッグします。
[グラフのフィールドリスト] で [AverageTimePerLevelTwoOperators] を選択し、それをグラフ領域の [ここにカテゴリフィールドをドロップします] と書かれたボックスにドラッグします。

グラフが更新され、オペレーターの増員と平均サービスグレードとの間の相関関係が表示されます。線形関係はなさそうです。新しいフィールドをグラフにドロップするか、グラフの種類を変更することによって、引き続き調査を行うことができます。

ただし、通常、これらのグラフで一度に表示できる属性はほんのわずかです。一方、ニューラルネットワークのアルゴリズムでは、複数の入力が関係する複雑な相互関係が分析されます。また、ニューラルネットワークモデルでは、微弱すぎてグラフで表現できないような、さまざまな相関関係が検出されます。

Visio 用データマイニングテンプレートを使用すれば、図をエクスポートしたり、複雑なニューラルネットワークモデルのプレゼンテーションを作成したりすることができます。これは、Visio 2007 用に無償で提供されているアドインです。データマイニングモデルの精巧な図を作成することが可能です。この図をカスタマイズすることによって、プレゼンテーションやレポートに使用することができます。詳細については、「Office 2007 用データマイニングアドイン」を参照してください。

トップに戻る

このレッスンの次の作業

コールセンター構造へのロジスティック回帰モデルの追加 (中級者向けデータマイニングチュートリアル)

次の方法で共有

コールセンターモデルの検証 (中級者向けデータマイニングチュートリアル)

Microsoft ニューラルネットワークビューアー

[出力] ペインの使用

最低と最高のサービスグレードを比較するには

[変数] ペインの使用

属性の確率スコアとリフトスコアを表示およびコピーするには

[入力] ペインの使用

入力属性を変更することによってサービスグレードへの影響をレビューするには

ビューアーに表示される統計の解釈

Microsoft 汎用コンテンツツリービューアー

マイニングモデルからデータ値の概要を取得するには

データソースビューデザイナー

マイニングモデルから傾向を示すピボットグラフを作成するには

このレッスンの次の作業

関連項目

タスク

参照

概念

その他のリソース

次の方法で共有

コール センター モデルの検証 (中級者向けデータ マイニング チュートリアル)

Microsoft ニューラル ネットワーク ビューアー

[出力] ペインの使用

最低と最高のサービス グレードを比較するには

[変数] ペインの使用

属性の確率スコアとリフト スコアを表示およびコピーするには

[入力] ペインの使用

入力属性を変更することによってサービス グレードへの影響をレビューするには

ビューアーに表示される統計の解釈

Microsoft 汎用コンテンツ ツリー ビューアー

マイニング モデルからデータ値の概要を取得するには

データ ソース ビュー デザイナー

マイニング モデルから傾向を示すピボット グラフを作成するには

このレッスンの次の作業

関連項目

タスク

参照

概念

その他のリソース

コールセンターモデルの検証 (中級者向けデータマイニングチュートリアル)

Microsoft ニューラルネットワークビューアー

最低と最高のサービスグレードを比較するには

属性の確率スコアとリフトスコアを表示およびコピーするには

入力属性を変更することによってサービスグレードへの影響をレビューするには

Microsoft 汎用コンテンツツリービューアー

マイニングモデルからデータ値の概要を取得するには

データソースビューデザイナー

マイニングモデルから傾向を示すピボットグラフを作成するには