コールセンターモデルの検証 (中級者向けデータマイニングチュートリアル)

[アーティクル]
11/17/2016

対象: SQL Server 2016 Preview

調査モデルを構築したら、それを使用して、データについてより深く考察することができます。具体的には、SQL Server Data Tools (SSDT) に備わっている次のツールを使用します。

Microsoft ニューラルネットワークビューアー**:** このビューアーはで使用できる、 マイニングモデルビューアー データマイニングデザイナーのタブをクリックします。データの相互作用をテストするために設計されています。
Microsoft 汎用コンテンツツリービューアー**:** この標準的なビューアーは、パターンに関する詳細を提供し、統計モデルの検出されたアルゴリズムによって生成時にします。

Microsoft ニューラルネットワークビューアー

ビューアーが 3 つのペイン: 入力, 、出力, 、および変数します。

使用して、出力 ] ウィンドウで、予測可能な属性または従属変数に別の値を選択することができます。属性を選択できますが、モデルに複数の予測可能な属性が含まれている場合、 出力属性 ] ボックスの一覧です。

変数ウィンドウが関係している属性、または変数の観点から選択した 2 つの結果を比較します。色分けされたバーは、対象となる結果に対し、変数がどの程度強く影響を与えているかを視覚的に表します。変数のリフトスコアを表示することもできます。リフトスコアは、使用しているマイニングモデルの種類によって計算方法が異なりますが、一般には、予測にこの属性を使用した場合のモデルの改善状況を示します。

入力ウィンドウを使用して、さまざまな what-if シナリオを試してモデルにな影響元を追加できます。

[出力] ペインの使用

この初期モデルでは、サービスのグレードに対して各種の要因がどのように影響を及ぼしているかを調べます。これを行うには、出力属性の一覧からサービスグレードを選択してドロップダウンリストから範囲を選択して異なるレベルのサービスを比較することができます 値 1 と 値 2します。

最低と最高のサービスグレードを比較するには

値 1, 、最小値を持つ範囲を選択します。たとえば、0 ～ 0.07 の範囲は、最低の電話放棄呼率 (つまり、最高のサービス水準) を表します。

注意

この範囲に含まれる厳密な値は、モデルの構成方法によって異なる場合があります。
値 2, 、最高の値を含む範囲を選択します。たとえば、値が >=0.12 の範囲は、最高の電話放棄呼率 (つまり、最も悪いサービスグレード) を表します。つまり、このシフト中に電話をかけてきた顧客の 12% が、担当者が応対する前に電話を切ったことになります。

内容、変数ペインが更新され、結果の値に影響を与える属性を比較します。左側の列は、最高グレードのサービスに関連付けられている属性を表し、右側の列は、最低グレードのサービスに関連付けられている属性を表します。

[変数] ペインの使用

このモデルのように見えます Averagetimeperissue 重要な要素です。この変数は、問い合わせの種類に関係なく、問い合わせから回答までに要した平均時間を示します。

属性の確率スコアとリフトスコアを表示およびコピーするには

変数 ] ウィンドウで、最初の行の色分けされたバー上にマウスを置きます。

この色分けされたバーではどの程度 Averagetimeperissue サービスグレードに貢献します。ツールヒントには、変数と対象となる結果の組み合わせごとに、全体的なスコア、確率、およびリフトスコアが表示されます。
変数 ] ウィンドウで、右クリックし、色分けされたバー、[ コピーします。
Excel ワークシートでは、任意のセルを右クリックして 貼り付けします。

レポートが HTML テーブルとして貼り付けられ、各バーのスコアだけが表示されます。
別の Excel ワークシートでは、任意のセルを右クリックして 貼り付けします。

レポートがテキスト形式で貼り付けられ、関連する統計 (次のセクションで説明) が表示されます。

[入力] ペインの使用

シフトやオペレーターの人数など、特定の要因の影響を調べているとします。使用して、特定の変数を選択できます、入力 ] ウィンドウで、および変数以前選択したグループが指定された変数を指定した 2 つを比較ウィンドウが自動的に更新します。

入力属性を変更することによってサービスグレードへの影響をレビューするには

入力 ] ウィンドウの属性, 、shift キーを選択します。
値, [ AMします。

変数ペインが更新されて、シフトはときに、モデルに影響を表示する AMします。それ以外のすべての選択内容は変わりません。引き続き、最低と最高のサービスグレードが対比されます。
値, [ PM1します。

変数、shift キーが変更されたときに、モデルに影響を表示するペインが更新されます。
入力 ] ウィンドウで、下にある次の空白行をクリックして属性, の呼び出しを選択します。値, 、呼び出しの最大数を示す範囲を選択します。

リストに新しい入力条件が追加されます。変数、問い合わせ件数が最も高いときに、特定のシフトについて、モデルへの影響を表示するペインが更新されます。
[シフト] および [問い合わせ] の値を変更しながら、シフト、問い合わせ件数、およびサービスグレードの間に、何か相関関係がないか見極めます。

注意

オフにする、入力ペインのさまざまな属性を使用できるようにクリックして ビューアーのコンテンツを更新します。

ビューアーに表示される統計の解釈

待ち時間が長ければ、電話放棄呼率が高くなり、サービスグレードも低下します。当然の結果のようにも見えますが、マイニングモデルは、その傾向を読み解くための補足的な統計データをいくつか提供します。

スコア: 結果を区別するためには、この変数の全体的な重要度を示す値。スコアが高いほど、その変数が結果に及ぼす影響は強くなります。
値 1 の確率: 結果に対する値の確率を表す割合です。
値 2 の確率: 結果に対する値の確率を表す割合です。
値 1 のリフト と 値 2 のリフト: 値 1] および [値 2 の結果を予測するにこの特定の変数の影響度を表すスコア。スコアが高いほど、その変数を使って、効果的に結果を予測することができます。

次の表に、トップインフルエンサについて、いくつかの値の例を示します。たとえば、 値 1 の確率 60.6% と 値 2 の確率 は 8.30%、案件あたり平均時間が 44 ~ 70 分の範囲内に、最高のサービスグレード (値 1) と shift キーを押し、ケースの 60.6% とケースの 8.30% は悪いサービスグレード (値 2) にシフトされたことを意味します。

この情報からは、いくつかの結論を導き出すことができます。問い合わせ応対時間が短いことは (44 ～ 70 の範囲)、サービスグレードの向上に強く影響しています (0.00 ～ 0.07 の範囲)。スコア (92.35) からも、この変数が非常に重要であることがわかります。

ただし、要因リストの下の方に目を向けると、影響が微弱で解釈が難しいその他の要因がいくつか確認できます。たとえば、シフトは一見、サービスに影響を及ぼすように見えますが、リフトスコアおよび相対的確率を見る限り、シフトはさほど大きな要因ではありません。

属性	値	水準 < 0.07	水準 >= 0.12
案件あたりの平均時間	89.087 - 120.000		スコア: 100 値 1 の確率: 4.45% 値 2 の確率: 51.94% 値 1 のリフト: 0.19 値 2 のリフト: 1.94
案件あたりの平均時間	44.000 - 70.597	スコア : 92.35 値 1 の確率 : 60.06 % 値 2 の確率 : 8.30 % 値 1 のリフト : 2.61 値 2 のリフト : 0.31

トップに戻る

Microsoft 汎用コンテンツツリービューアー

このビューアーを使用すると、モデルの処理時にアルゴリズムによって作成された、さらに詳しい情報を閲覧できます。 MicrosoftGeneric コンテンツツリービューアー として、一連のノード、各ノードが、トレーニングデータに関する学習済みの知識を表すであり、マイニングモデルを表します。このビューアーは、あらゆるモデルで使用できますが、ノードの内容はモデルの種類によって異なります。

ニューラルネットワークモデルまたはロジスティック回帰モデルの場合があります、 マージナル統計ノード 特に便利です。このノードには、データに含まれる値の分布に関して得られた統計が表示されます。この情報は、多数の T-SQL クエリを作成せずにデータの概要を取得する必要がある場合に、役立てることができます。前のトピックで、ビン分割値のグラフを取り上げましたが、このグラフは、マージナル統計ノードから導かれたものです。

マイニングモデルからデータ値の概要を取得するには

データマイニングデザイナーでの マイニングモデルビューアー ] タブで [ します。
ビューアー 一覧で、Microsoft 汎用コンテンツツリービューアーします。

マイニングモデルのビューが更新されて、左側のペインにノード階層が、右側のペインに HTML テーブルが表示されます。
ノードのキャプション ウィンドウで、10000000000000000 という名前のノードをクリックします。

どのモデルにも言えることですが、最上位のノードは常に、そのモデルのルートノードです。ニューラルネットワークモデルまたはロジスティック回帰モデルでは、その直下のノードがマージナル統計ノードです。
ノードの詳細 ] ウィンドウで、NODE_DISTRIBUTION という行が表示されるまで下へスクロールします。
NODE_DISTRIBUTION テーブルを下にスクロールして、ニューラルネットワークのアルゴリズムによって計算された値の分布を表示します。

このデータをレポートに使用するには、特定の行の情報を選択してコピーします。または、次のデータマイニング拡張機能 (DMX) クエリを使用して、ノードの完全な内容を抽出することもできます。

SELECT *   
FROM [Call Center EQ4].CONTENT  
WHERE NODE_NAME = '10000000000000000'

ノード階層と、NODE_DISTRIBUTION テーブル内の詳細情報を使用して、ニューラルネットワーク内のパスを個別にたどり、非表示になっているレイヤーの統計を閲覧することもできます。詳細については、次を参照してください。ニューラルネットワークモデルのクエリ例します。

トップに戻る

このレッスンの次の作業

コールセンター構造 #40; 中級者向けデータマイニングチュートリアル ) へのロジスティック回帰モデルの追加

参照

ニューラルネットワークモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)
ニューラルネットワークモデルのクエリ例
 Microsoft Neural Network Algorithm Technical Reference
マイニングモデルでの列の分離の変更

次の方法で共有

コールセンターモデルの検証 (中級者向けデータマイニングチュートリアル)

Microsoft ニューラルネットワークビューアー

[出力] ペインの使用

最低と最高のサービスグレードを比較するには

[変数] ペインの使用

属性の確率スコアとリフトスコアを表示およびコピーするには

[入力] ペインの使用

入力属性を変更することによってサービスグレードへの影響をレビューするには

ビューアーに表示される統計の解釈

Microsoft 汎用コンテンツツリービューアー

マイニングモデルからデータ値の概要を取得するには

このレッスンの次の作業

参照

その他のリソース

次の方法で共有

コール センター モデルの検証 (中級者向けデータ マイニング チュートリアル)

Microsoft ニューラル ネットワーク ビューアー

[出力] ペインの使用

最低と最高のサービス グレードを比較するには

[変数] ペインの使用

属性の確率スコアとリフト スコアを表示およびコピーするには

[入力] ペインの使用

入力属性を変更することによってサービス グレードへの影響をレビューするには

ビューアーに表示される統計の解釈

Microsoft 汎用コンテンツ ツリー ビューアー

マイニング モデルからデータ値の概要を取得するには

このレッスンの次の作業

参照

その他のリソース

コールセンターモデルの検証 (中級者向けデータマイニングチュートリアル)

Microsoft ニューラルネットワークビューアー

最低と最高のサービスグレードを比較するには

属性の確率スコアとリフトスコアを表示およびコピーするには

入力属性を変更することによってサービスグレードへの影響をレビューするには

Microsoft 汎用コンテンツツリービューアー

マイニングモデルからデータ値の概要を取得するには