フィルター選択されたモデルのテスト (基本的なデータ マイニング チュートリアル)
TM_Decision_Tree モデルが最も正確であることを確認できたら、Adventure Works Cycles の絞り込みメール配信キャンペーンのコンテキストでモデルを評価する必要があります。 Adventure Works Cycles のマーケティング部門は、自転車購入者の特性に男性と女性における違いがあるかどうかを把握しようとしています。 この情報は、広告用に使用する雑誌やダイレクト メールで特集する製品を決定する際に役立ちます。
このレッスンでは、性別に基づいてフィルター選択されたモデルを作成します。 その後、このモデルをコピーし、フィルター条件を変更するだけで、別の性別に基づく新しいモデルを生成できます。
フィルターの詳細については、「マイニング モデルのフィルター選択 (Analysis Services - データ マイニング)」を参照してください。
フィルターの使用
フィルター選択を行うと、データのサブセットに基づくモデルを簡単に作成できます。 フィルターはモデルにのみ適用され、基になるデータ ソースは変更しません。 入れ子になったテーブルへのフィルターの適用については、「中級者向けデータ マイニング チュートリアル (Analysis Services - データ マイニング)」を参照してください。
ケース テーブルに対するフィルター
まず、TM_Decision_Tree モデルのコピーを作成します。
デシジョン ツリー モデルをコピーするには
SQL Server データ ツール (SSDT) のソリューション エクスプローラーで、[BasicDataMining] をクリックします。
[マイニング モデル] タブをクリックします。
TM_Decision_Tree モデルを右クリックして、[新しいマイニング モデル] をクリックします。
[モデル名] フィールドに「TM_Decision_Tree_Male」と入力します。
[OK] をクリックします。
次に、性別に基づいてモデルの顧客を選択するフィルターを作成します。
マイニング モデルに対してケース フィルターを作成するには
TM_Decision_Tree_Male マイニング モデルを右クリックしてショートカット メニューを開きます。
または
モデルを選択します。 [マイニング モデル] メニューの [モデル フィルターの設定] をクリックします。
[モデル フィルター] ダイアログ ボックスで、[マイニング構造列] ボックスのグリッドの先頭行をクリックします。
ドロップダウン リストに、そのテーブルの列の名前のみが表示されます。
[マイニング構造列] ボックスで、[Gender] をクリックします。
テキスト ボックスの左側のアイコンが変化して、選択されたアイテムがテーブルであるか列であるかが示されます。
[演算子] ボックスをクリックし、一覧から等号 (=) 演算子を選択します。
[値] ボックスをクリックし、「M」と入力します。
グリッドの次の行をクリックします。
[OK] をクリックして、[モデル フィルター] ダイアログ ボックスを閉じます。
フィルターが [プロパティ] ウィンドウに表示されます。 [プロパティ] ウィンドウから [モデル フィルター] ダイアログ ボックスを開くこともできます。
上記の手順を繰り返しますが、今回はモデルに「TM_Decision_Tree_Female」という名前を付け、[値] ボックスに「F」と入力します。
これで、[マイニング モデル] タブに 2 つの新しいモデルが表示されるようになりました。
フィルター選択されたモデルの処理
モデルを使用するには、事前にそのモデルを配置して処理する必要があります。 モデルの処理の詳細については、「絞り込みメール配信構造でのモデルの処理 (基本的なデータ マイニング チュートリアル)」を参照してください。
フィルター選択されたモデルを処理するには
[TM_Decision_Tree_Male] モデルを右クリックして、[マイニング構造および全モデルの処理] をクリックします。
[実行] をクリックして新しいモデルを処理します。
処理が完了したら、両方の処理ウィンドウの [閉じる] をクリックします。
結果の評価
結果を表示してフィルター選択されたモデルの精度を評価する方法は、前の 3 つのモデルの場合とほぼ同じです。 詳細については、以下のトピックを参照してください。
デシジョン ツリー モデルの検証 (基本的なデータ マイニング チュートリアル)
リフト チャートを使用した精度テスト (基本的なデータ マイニング チュートリアル)
フィルター選択されたモデルを調査するには
データ マイニング デザイナーで、[マイニング モデル ビューアー] タブをクリックします。
[マイニング モデル] ボックスで、[TM_Decision_Tree_Male] を選択します。
[表示レベル] を 3 までスライドさせます。
[背景] の値を 1 に変更します。
"すべて" というラベルが付いたノードの上にカーソルを置き、自転車購入者数と自転車非購入者数を比較します。
TM_Decision_Tree_Female に対して手順 1. ~ 5. を繰り返します。
TM_Decision_Tree と性別に基づいてフィルター選択されたモデルの結果を検証します。 すべての自転車購入者と比較すると、男性の自転車購入者および女性の自転車購入者には、フィルター選択されていない自転車購入者と同じ特性もいくつかありますが、この 3 者には興味深い相違点もあります。 Adventure Works Cycles は、この有益な情報を使用してマーケティング キャンペーンを展開できます。
フィルター選択されたモデルのリフトをテストするには
SQL Server データ ツール (SSDT) のデータ マイニング デザイナーの [マイニング精度チャート] タブに切り替えて、[入力の選択] タブをクリックします。
[精度チャートに使用するデータセットの選択] グループ ボックスで、[マイニング構造のテスト ケースを使用する] をクリックします。
データ マイニング デザイナーの [入力の選択] タブにある [リフト チャートに表示する予測可能なマイニング モデル列の選択] で、[予測列と値の同期] チェック ボックスをオンにします。
[予測可能列名] 列で、各モデルについて [Bike Buyer] が選択されていることを確認します。
[表示] 列で、各モデルのチェック ボックスをオンにします。
[予測値] 列で [1] を選択します。
[リフト チャート] タブをクリックして、リフト チャートを表示します。
3 つすべてのデシジョン ツリー モデルでランダム推測モデルよりも大幅なリフトが見られ、クラスター モデルや Naive Bayes モデルより高精度であることがわかります。
このレッスンの前の作業
リフト チャートを使用した精度テスト (基本的なデータ マイニング チュートリアル)
次のレッスン
レッスン 6: 予測の作成と操作 (基本的なデータ マイニング チュートリアル)
関連項目
タスク
概念
中級者向けデータ マイニング チュートリアル (Analysis Services - データ マイニング)
マイニング モデルのフィルター選択 (Analysis Services - データ マイニング)