コール センター モデルの検証 (中級者向けデータ マイニング チュートリアル)
対象: SQL Server 2016 Preview
調査モデルを構築したら、それを使用して、データについてより深く考察することができます。具体的には、SQL Server Data Tools (SSDT) に備わっている次のツールを使用します。
Microsoft ニューラル ネットワーク ビューアー**:** このビューアーはで使用できる、 マイニング モデル ビューアー データ マイニング デザイナーのタブをクリックします。 データの相互作用をテストするために設計されています。
Microsoft 汎用コンテンツ ツリー ビューアー**:** この標準的なビューアーは、パターンに関する詳細を提供し、統計モデルの検出されたアルゴリズムによって生成時にします。
Microsoft ニューラル ネットワーク ビューアー
ビューアーが 3 つのペイン: 入力, 、出力, 、および 変数します。
使用して、 出力 ] ウィンドウで、予測可能な属性または従属変数に別の値を選択することができます。 属性を選択できますが、モデルに複数の予測可能な属性が含まれている場合、 出力属性 ] ボックスの一覧です。
変数 ウィンドウが関係している属性、または変数の観点から選択した 2 つの結果を比較します。 色分けされたバーは、対象となる結果に対し、変数がどの程度強く影響を与えているかを視覚的に表します。 変数のリフト スコアを表示することもできます。 リフト スコアは、使用しているマイニング モデルの種類によって計算方法が異なりますが、一般には、予測にこの属性を使用した場合のモデルの改善状況を示します。
入力 ウィンドウを使用して、さまざまな what-if シナリオを試してモデルにな影響元を追加できます。
[出力] ペインの使用
この初期モデルでは、サービスのグレードに対して各種の要因がどのように影響を及ぼしているかを調べます。 これを行うには、出力属性の一覧からサービス グレードを選択してドロップダウン リストから範囲を選択して異なるレベルのサービスを比較することができます 値 1 と 値 2します。
最低と最高のサービス グレードを比較するには
値 1, 、最小値を持つ範囲を選択します。 たとえば、0 ~ 0.07 の範囲は、最低の電話放棄呼率 (つまり、最高のサービス水準) を表します。
注意
この範囲に含まれる厳密な値は、モデルの構成方法によって異なる場合があります。値 2, 、最高の値を含む範囲を選択します。 たとえば、値が >=0.12 の範囲は、最高の電話放棄呼率 (つまり、最も悪いサービス グレード) を表します。 つまり、このシフト中に電話をかけてきた顧客の 12% が、担当者が応対する前に電話を切ったことになります。
内容、 変数 ペインが更新され、結果の値に影響を与える属性を比較します。 左側の列は、最高グレードのサービスに関連付けられている属性を表し、右側の列は、最低グレードのサービスに関連付けられている属性を表します。
[変数] ペインの使用
このモデルのように見えます Averagetimeperissue 重要な要素です。 この変数は、問い合わせの種類に関係なく、問い合わせから回答までに要した平均時間を示します。
属性の確率スコアとリフト スコアを表示およびコピーするには
変数 ] ウィンドウで、最初の行の色分けされたバー上にマウスを置きます。
この色分けされたバーではどの程度 Averagetimeperissue サービス グレードに貢献します。 ツールヒントには、変数と対象となる結果の組み合わせごとに、全体的なスコア、確率、およびリフト スコアが表示されます。
変数 ] ウィンドウで、右クリックし、色分けされたバー、[ コピーします。
Excel ワークシートでは、任意のセルを右クリックして 貼り付けします。
レポートが HTML テーブルとして貼り付けられ、各バーのスコアだけが表示されます。
別の Excel ワークシートでは、任意のセルを右クリックして 貼り付けします。
レポートがテキスト形式で貼り付けられ、関連する統計 (次のセクションで説明) が表示されます。
[入力] ペインの使用
シフトやオペレーターの人数など、特定の要因の影響を調べているとします。 使用して、特定の変数を選択できます、 入力 ] ウィンドウで、および 変数 以前選択したグループが指定された変数を指定した 2 つを比較ウィンドウが自動的に更新します。
入力属性を変更することによってサービス グレードへの影響をレビューするには
入力 ] ウィンドウの 属性, 、shift キーを選択します。
値, [ AMします。
変数 ペインが更新されて、シフトはときに、モデルに影響を表示する AMします。 それ以外のすべての選択内容は変わりません。引き続き、最低と最高のサービス グレードが対比されます。
値, [ PM1します。
変数 、shift キーが変更されたときに、モデルに影響を表示するペインが更新されます。
入力 ] ウィンドウで、下にある次の空白行をクリックして 属性, の呼び出しを選択します。 値, 、呼び出しの最大数を示す範囲を選択します。
リストに新しい入力条件が追加されます。 変数 、問い合わせ件数が最も高いときに、特定のシフトについて、モデルへの影響を表示するペインが更新されます。
[シフト] および [問い合わせ] の値を変更しながら、シフト、問い合わせ件数、およびサービス グレードの間に、何か相関関係がないか見極めます。
注意
オフにする、 入力 ペインのさまざまな属性を使用できるようにクリックして ビューアーのコンテンツを更新します。
ビューアーに表示される統計の解釈
待ち時間が長ければ、電話放棄呼率が高くなり、サービス グレードも低下します。 当然の結果のようにも見えますが、マイニング モデルは、その傾向を読み解くための補足的な統計データをいくつか提供します。
スコア: 結果を区別するためには、この変数の全体的な重要度を示す値。 スコアが高いほど、その変数が結果に及ぼす影響は強くなります。
値 1 の確率: 結果に対する値の確率を表す割合です。
値 2 の確率: 結果に対する値の確率を表す割合です。
値 1 のリフト と 値 2 のリフト: 値 1] および [値 2 の結果を予測するにこの特定の変数の影響度を表すスコア。 スコアが高いほど、その変数を使って、効果的に結果を予測することができます。
次の表に、トップ インフルエンサについて、いくつかの値の例を示します。 たとえば、 値 1 の確率 60.6% と 値 2 の確率 は 8.30%、案件あたり平均時間が 44 ~ 70 分の範囲内に、最高のサービス グレード (値 1) と shift キーを押し、ケースの 60.6% とケースの 8.30% は悪いサービス グレード (値 2) にシフトされたことを意味します。
この情報からは、いくつかの結論を導き出すことができます。 問い合わせ応対時間が短いことは (44 ~ 70 の範囲)、サービス グレードの向上に強く影響しています (0.00 ~ 0.07 の範囲)。 スコア (92.35) からも、この変数が非常に重要であることがわかります。
ただし、要因リストの下の方に目を向けると、影響が微弱で解釈が難しいその他の要因がいくつか確認できます。 たとえば、シフトは一見、サービスに影響を及ぼすように見えますが、リフト スコアおよび相対的確率を見る限り、シフトはさほど大きな要因ではありません。
属性 | 値 | 水準 < 0.07 | 水準 >= 0.12 |
---|---|---|---|
案件あたりの平均時間 | 89.087 - 120.000 | スコア: 100 値 1 の確率: 4.45% 値 2 の確率: 51.94% 値 1 のリフト: 0.19 値 2 のリフト: 1.94 |
|
案件あたりの平均時間 | 44.000 - 70.597 | スコア : 92.35 値 1 の確率 : 60.06 % 値 2 の確率 : 8.30 % 値 1 のリフト : 2.61 値 2 のリフト : 0.31 |
トップに戻る
Microsoft 汎用コンテンツ ツリー ビューアー
このビューアーを使用すると、モデルの処理時にアルゴリズムによって作成された、さらに詳しい情報を閲覧できます。 MicrosoftGeneric コンテンツ ツリー ビューアー として、一連のノード、各ノードが、トレーニング データに関する学習済みの知識を表すであり、マイニング モデルを表します。 このビューアーは、あらゆるモデルで使用できますが、ノードの内容はモデルの種類によって異なります。
ニューラル ネットワーク モデルまたはロジスティック回帰モデルの場合があります、 マージナル統計ノード 特に便利です。 このノードには、データに含まれる値の分布に関して得られた統計が表示されます。 この情報は、多数の T-SQL クエリを作成せずにデータの概要を取得する必要がある場合に、役立てることができます。 前のトピックで、ビン分割値のグラフを取り上げましたが、このグラフは、マージナル統計ノードから導かれたものです。
マイニング モデルからデータ値の概要を取得するには
データ マイニング デザイナーでの マイニング モデル ビューアー ] タブで [ します。
ビューアー 一覧で、Microsoft 汎用コンテンツ ツリー ビューアーします。
マイニング モデルのビューが更新されて、左側のペインにノード階層が、右側のペインに HTML テーブルが表示されます。
ノードのキャプション ウィンドウで、10000000000000000 という名前のノードをクリックします。
どのモデルにも言えることですが、最上位のノードは常に、そのモデルのルート ノードです。 ニューラル ネットワーク モデルまたはロジスティック回帰モデルでは、その直下のノードがマージナル統計ノードです。
ノードの詳細 ] ウィンドウで、NODE_DISTRIBUTION という行が表示されるまで下へスクロールします。
NODE_DISTRIBUTION テーブルを下にスクロールして、ニューラル ネットワークのアルゴリズムによって計算された値の分布を表示します。
このデータをレポートに使用するには、特定の行の情報を選択してコピーします。または、次のデータ マイニング拡張機能 (DMX) クエリを使用して、ノードの完全な内容を抽出することもできます。
SELECT *
FROM [Call Center EQ4].CONTENT
WHERE NODE_NAME = '10000000000000000'
ノード階層と、NODE_DISTRIBUTION テーブル内の詳細情報を使用して、ニューラル ネットワーク内のパスを個別にたどり、非表示になっているレイヤーの統計を閲覧することもできます。 詳細については、次を参照してください。 ニューラル ネットワーク モデルのクエリ例します。
トップに戻る
このレッスンの次の作業
コール センター構造 #40; 中級者向けデータ マイニング チュートリアル ) へのロジスティック回帰モデルの追加
参照
ニューラル ネットワーク モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)
ニューラル ネットワーク モデルのクエリ例
Microsoft Neural Network Algorithm Technical Reference
マイニング モデルでの列の分離の変更