リフトチャートを使用した精度テスト (基本的なデータマイニングチュートリアル)

[アーティクル]
05/07/2013

データマイニングデザイナーの [マイニング精度チャート] タブでは、各モデルの予測精度を計算し、その結果をモデル間で直接比較できます。この比較方法をリフトチャートといいます。通常、マイニングモデルの予測精度は、リフトまたは分類の精度によって測定します。このチュートリアルでは、リフトチャートのみを使用します。リフトチャートおよびその他の精度チャートの詳細については、「モデルの精度をグラフ化するためのツール (Analysis Services - データマイニング)」を参照してください。

このトピックでは次の作業を行います。

入力データの選択
モデル、予測可能列、および値の選択

入力データの選択

マイニングモデルの精度をテストするには、まず、テストに使用するデータソースを選択する必要があります。テストデータに対するモデルの予測精度をテストし、その後で外部データに対してモデルを使用します。

データセットを選択するには

SQL Server データツール (SSDT) のデータマイニングデザイナーの [マイニング精度チャート] タブに切り替えて、[入力の選択] タブをクリックします。
[精度チャートに使用するデータセットの選択] グループボックスで [マイニング構造のテストケースを使用する] を選択し、マイニング構造の作成時に確保しておいたテストデータを使用してモデルをテストします。

その他のオプションの詳細については、「精度チャートの種類の選択とグラフのオプションの設定」を参照してください。

モデル、予測可能列、および値の選択

次に、リフトチャートに表示するモデル、各モデルの比較に使用する予測可能列、および予測する値を選択します。

注
[予測可能列名] ボックスの一覧に表示されるマイニングモデル列は、使用法が Predict または Predict Only に設定されていて、コンテンツの種類が Discrete または Discretized である列だけです。

モデルのリフトを表示するには

データマイニングデザイナーの [入力の選択] タブにある [リフトチャートに表示する予測可能なマイニングモデル列の選択] で、[予測列と値の同期] チェックボックスをオンにします。
[予測可能列名] 列で、各モデルについて [Bike Buyer] が選択されていることを確認します。
[表示] 列で、各モデルのチェックボックスをオンにします。

既定では、マイニング構造内のすべてのモデルが選択されます。モデルを除外することもできますが、このチュートリアルではすべてのモデルを選択したままにしておきます。
[予測値] 列で [1] を選択します。同じ予測可能列を持つモデルのそれぞれに対して、同じ値が自動的に設定されます。
[リフトチャート] タブをクリックして、リフトチャートを表示します。

このタブをクリックすると、サーバーとデータベースに対し、指定のマイニング構造および指定の入力テーブルまたはテストデータの予測クエリが実行されます。結果がグラフとして表示されます。

[予測値] に値を入力すると、リフトチャートによってランダム推測モデルと理想モデルが表示されます。作成したマイニングモデルは、この 2 極、つまりランダムな推測と、完璧な予測の間に位置します。ランダムな推測に対する改善は、すべてリフトと見なされます。
凡例を使用して、理想モデルとランダム推測モデルを表す色付きの線を配置します。

TM_Decision_Tree モデルが最もリフトが大きく、Clustering モデルや Naive Bayes モデルより高精度であることがわかります。

このレッスンで作成したものに類似したリフトチャートの詳細については、「リフトチャート (Analysis Services - データマイニング)」を参照してください。

このレッスンの次の作業

フィルター選択されたモデルのテスト (基本的なデータマイニングチュートリアル)

次の方法で共有

リフトチャートを使用した精度テスト (基本的なデータマイニングチュートリアル)

入力データの選択

データセットを選択するには

モデル、予測可能列、および値の選択

モデルのリフトを表示するには

このレッスンの次の作業

関連項目

参照

概念

その他のリソース

次の方法で共有

リフト チャートを使用した精度テスト (基本的なデータ マイニング チュートリアル)

入力データの選択

データ セットを選択するには

モデル、予測可能列、および値の選択

モデルのリフトを表示するには

このレッスンの次の作業

関連項目

参照

概念

その他のリソース

リフトチャートを使用した精度テスト (基本的なデータマイニングチュートリアル)

データセットを選択するには