散布図 (Analysis Services - データ マイニング)
散布図は、連続する予測可能な属性を含むモデル (タイム シリーズ モデルを除く) を選択すると自動的に [リフト チャート] タブに表示されます。散布図では、モデルで予測された値とデータの実際の値がグラフで比較されます。実際の値は X 軸に表示され、予測された値は Y 軸に表示されます。そのほかに、完璧な予測 (予測された値が実際の値と完全に一致する状態) を表す線も表示されます。この理想的な 45 度の線からの距離により、それぞれの点の予測の正確さがわかります。
ここでは、散布図を作成する方法と、その結果を解釈する方法について説明します。
注 |
---|
散布図では、連続する予測可能な属性を含むマイニング モデルのみを表示できます。 |
シナリオ
たとえば、Adventure Works Cycles のマーケティング部門で、販促用電子メールで送信したリンクがクリックされた回数に基づいて毎日の売上を予測するモデルが使用されていたとします。クリックの回数と売上高はどちらも連続する数値なので、クリックの回数を独立変数とし、売上を従属変数として、グラフに表すことができます。この場合、グラフの直線は期待される直線関係を表し、直線の周りに散らばる点は、実際のデータがその予測からどれだけ逸脱しているかを表します。この分析により、一連の結果と特定の入力との関連性と、理想的なモデルからの偏差の大きさが一目でわかります。
散布図について
次の図は、上で説明したシナリオのために作成された散布図の例を示しています。
直線の周りに散らばっている点の上にマウス ポインタを置くと、予測された値と実際の値がツールヒントに表示されます。散布図には [マイニング凡例] はありませんが、グラフ自体に、モデルに関連付けられているスコアを表示する凡例が含まれています。スコアの解釈の詳細については、「線形回帰モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。
グラフの視覚的な表現はクリップボードにコピーできますが、基になるデータや式をコピーすることはできません。直線の回帰式を表示するには、モデルに対するコンテンツ クエリを作成します。詳細については、「線形回帰モデルのクエリ (Analysis Services - データ マイニング)」を参照してください。
散布図の作成
散布図を作成する場合は次の手順を実行します。
データ マイニング デザイナの [マイニング精度チャート] で、[入力の選択] タブをクリックします。
[入力の選択] タブで、評価するモデルを選択します。連続する数値データ型の予測可能な属性を含むモデルを選択する必要があります。
予測可能な属性を選択します。
評価に使用するデータセットを選択します。
必要に応じて、データセットにフィルタを適用します。
[リフト チャート] タブをクリックすると、自動的に散布図レポートが生成されます。
すべてのグラフの種類に当てはまる詳しい手順については、「マイニング モデルの精度チャートを作成する方法」を参照してください。