予測の作成 (基本的なデータ マイニング チュートリアル)
対象: SQL Server 2016 Preview
予測クエリ ビルダーを使用して予測を生成できますし、マイニング モデルの精度をテストし、結果に満足していることにしましたが後、 マイニング モデル予測 データ マイニング デザイナーのタブをクリックします。
予測クエリ ビルダーには 3 つのビューがあります。 デザイン と クエリ ビューを構築して、クエリを調査できます。 クエリを実行し、結果の表示、 結果 表示します。
すべての予測クエリは、DMX を使用します。DMX とは、データ マイニング拡張機能 (Data Mining Extensions、DMX) 言語の略称です。 DMX の構文は T-SQL と似ていますが、データ マイニング オブジェクトに対するクエリに使用されます。 DMX 構文は複雑ではありませんが、やのようなクエリ ビルダーを使用して、 SQL Server データ マイニング アドインを Office, 、入力値を選択し、基本事項を説明することを強くお勧めしているため、式の構築をはるかに簡単になります。
クエリを作成します。
予測クエリを作成するには、まず、マイニング モデルと入力テーブルを選択します。
モデルと入力テーブルを選択するには
マイニング モデル予測 データ マイニング デザイナーのタブで、 マイニング モデルの ボックスで、クリックして モデルの選択します。
マイニング モデルの選択 ] ダイアログ ボックスで、ツリーから移動、 Targeted Mailing 構造体、構造を展開し、選択 TM_Decision_Tree, 、] をクリックし、 OKします。
入力テーブルの選択 ボックスで、クリックして [ケース テーブルのです。
テーブルの選択 ダイアログ ボックスで、 データソース 一覧で、データ ソース ビューを選択 Adventure Works DW Multidimensional 2012します。
テーブル/ビュー名, を選択、 [ProspectiveBuyer (dbo) ] をクリックし、 **[ok]**します。
ProspectiveBuyer に最もよく似たテーブル、 vTargetMail ケース テーブル。
列のマップ
入力テーブルを選択すると、列名に基づいてマイニング モデルと入力テーブルの間に既定のマッピングが作成されます。 構造の列と外部データの列は 1 つ以上一致する必要があります。
重要
モデルの精度を判断するために使用するデータには、予測可能列にマッピングできる列が含まれている必要があります。 そのような列が存在しない場合は、空の値で列を作成できますが、データ型が予測可能列と同じである必要があります。
入力をモデルにマップするには
結合する線を右クリックし、 マイニング モデルの ウィンドウ、 [入力テーブルの ウィンドウ、および選択 接続の変更します。
すべての列をマップするわけではありません。 いくつかのマッピングを追加します テーブル列します。 一致する列を増やすため、現在の日付の列に基づいて新しい生年月日の列も生成します。
[ テーブル列, 、] をクリックして、 Bike Buyer セルし、ドロップダウン リストから [ProspectiveBuyer.Unknown を選択します。
これにより、予測可能列 [Bike Buyer] が入力テーブルの列にマップされます。
**[OK]**をクリックします。
ソリューション エクスプ ローラー, を右クリックし、 Targeted Mailing データ ソース ビューを選択して ビュー デザイナーします。
テーブル、ProspectiveBuyer を右クリックして 新しい名前付き計算します。
名前付き計算の作成 ] ダイアログ ボックスの 列名, 、型 calcage」と入力します。
説明, 、型 誕生日に基づく年齢を計算します。
式 ボックスに、入力 DATEDIFF(YYYY,[BirthDate],getdate()) ] をクリックし、 OKします。
入力テーブルがあるないのため **年齢** モデルでは、1 つに対応する列、入力テーブルの BirthDate 列から顧客の年齢を計算する式を使用します。 **年齢** が最も大きく影響と見なされて両方のモデルでは、入力テーブル内に存在する必要があります自転車の購入を予測するための列です。
データ マイニング デザイナーで、選択、 マイニング モデル予測 タブから、再度開いて、 接続の変更 ウィンドウです。
[ テーブル列, 、] をクリックして、 年齢 セルし、ドロップダウン リストから [ProspectiveBuyer.calcAge を選択します。
警告
一覧に列が表示されない場合は、場合によって、デザイナーに読み込まれたデータ ソース ビューの定義を更新する必要があります。 、 ファイル メニューの [ すべてを保存, 、終了して、デザイナーでプロジェクトを再度開きます。**[OK]**をクリックします。
予測クエリのデザイン
最初のボタンのツールバーで、 マイニング モデル予測 タブは、 デザインにスイッチを表示]、[結果ビューに切り替え]、[クエリ ビューに切り替え ] ボタンをクリックします。 このボタンに下向きの矢印をクリックし、選択 デザインします。
上のグリッドに、 マイニング モデル予測 ] タブで、最初の空行のセルをクリックして、 ソース 列、および選択 予測関数します。
予測関数 行の フィールド 列で、選択 PredictProbabilityします。
エイリアス 、同じ行型の列 結果の確率します。
マイニング モデルの ウィンドウの上部を選択し、[Bike Buyer] にドラッグ、 条件と引数 セル。
離すと、[TM_Decision_Tree] です。[Bike Buyer] が表示される、 **条件と引数** セル。
対象列の指定、 **PredictProbability** 関数です。 関数の詳細については、次を参照してください。 [データ マイニング拡張機能と #40; DMX & #41 です。関数リファレンス](../Topic/Data%20Mining%20Extensions%20(DMX)%20Function%20Reference.md)します。
次の空白行をクリックして、 ソース 列、および [TM_Decision_Tree マイニング モデルします。
TM_Decision_Tree 行の フィールド 列で、選択 Bike Buyerします。
TM_Decision_Tree 行の 条件と引数 列に「 = 1します。
次の空白行をクリックして、 ソース 列、および選択 ProspectiveBuyer テーブルします。
ProspectiveBuyer 行の フィールド 列で、選択 **[prospectivebuyerkey]**します。
予測クエリに一意識別子が追加され、自転車を購入する可能性が高い顧客とそうでない顧客を特定できるようになります。
グリッドに 5 つの行を追加します。 行ごとに次のように選択します。 ProspectiveBuyer テーブル として、 ソース し、次の列を追加、 フィールド セル。
calcAge
LastName
FirstName
AddressLine1
AddressLine2
最後に、クエリを実行して結果を参照します。
予測クエリ ビルダー もこれらのコントロールが含まれています。
表示 ] チェック ボックス
句をデザイナーから削除せずに、句をクエリから削除することができます。 複雑なクエリを使用しているときに、DMX 構文のコピーとウィンドウへの貼り付けを行わずに構文を保持しようとする場合に役立ちます。
[グループ]
選択した行の先頭に開く (左) かっこを挿入するか、現在の行の末尾に閉じる (右) かっこを挿入します。
[AND]/[OR]
挿入、 AND 演算子または OR 、現在の関数または列の直後後の演算子です。
クエリを実行して結果を表示するには
マイニング モデル予測 ] タブを選択し、 結果 ] ボタンをクリックします。
クエリを実行して結果が表示されたら、その結果を確認できます。
マイニング モデル予測 タブには、自転車を購入する可能性がある潜在的な顧客の連絡先に関する情報が表示されます。 結果の確率 列は、精度が、予測の確率を示します。 これらの結果を使用すると、メールを送信する対象となる潜在顧客を特定できます。
この時点で、結果を保存できます。 この場合、3 つの選択肢があります。
結果内のデータの行を右クリックして コピー をクリップボードにその値のみ (および列見出し) を保存します。
結果の任意の行を右クリックして すべてコピー をクリップボードに列見出しを含む、全体の結果セットをコピーします。
クリックして クエリ結果の保存 次のように、データベースに直接の結果を保存します。
保存のデータ マイニング クエリの結果 ダイアログ ボックスで、データ ソースを選択するか、新しいデータ ソースを定義します。
クエリの結果が保存されるテーブルの名前を入力します。
オプションを使用 [DSV に追加, をテーブルを作成し、既存のデータ ソース ビューに追加します。 これは、モデルのすべての関連テーブル (トレーニング データ、予測ソース データ、クエリ結果など) を同じデータ ソース ビューで保持する場合に便利です。
オプションを使用 場合に上書きが存在する, 、最新の結果で、既存のテーブルを更新します。
予測クエリに列を追加した場合、予測クエリで列の名前またはデータ型を変更した場合、または保存先テーブルで ALTER ステートメントを実行した場合、このオプションを使用してテーブルを上書きする必要があります。
また、複数の列には、同じ名前が付いている (既定の列名などの 式) 同じ名前の列の別名を作成する必要がありますか、デザイナーが SQL Server に結果を保存しようとするときにエラーが発生します。 SQL Server では、複数の列に同じ名前が含まれることが許可されないためです。
詳細については、次を参照してください。 [保存データ マイニング クエリ結果] ダイアログ ボックスと #40 です。マイニング モデル予測] ビューと #41;](../Topic/Save%20Data%20Mining%20Query%20Result%20Dialog%20Box%20(Mining%20Model%20Prediction%20View).md)します。
このレッスンの次の作業
構造データと #40; へのドリルスルーの使用基本的なデータ マイニングのチュートリアルと #41 です。