レッスン 4: 絞り込みメール配信モデルの検証 (基本的なデータ マイニング チュートリアル)
対象: SQL Server 2016 Preview
プロジェクト内のモデルを処理した後、そのモデルを検証して、興味深い傾向を探すことができます。 パターンは複雑で、単純に数値を観察するだけでは見つけにくいことがあるため、SQL Server データ マイニング機能は、データを調査する目的、およびアルゴリズムがデータ内で見つけたルールとリレーションシップを理解する目的で役立つビジュアル ツールを用意しています。 また、さまざまな精度テストを使用してデータセットを検証し、モデルを配置する前にどのモデルが最も適切に機能するかを判断することができます。
使用すると SQL Server Data Tools (SSDT) で作成した各モデルを表示してモデルを参照する、 マイニング モデル ビューアー データ マイニング デザイナーのタブをクリックします。 各種のビューアーを使用して、モデルを参照できます。 これらのビューアーは、SQL Server Management Studio でも使用できます。
Analysis Services のどのアルゴリズムを使用してモデルを作成したかによって、それぞれ結果が異なります。 したがって、Analysis Services は、機械学習モデルの種類ごとにカスタム ビューアーを用意しています。
詳細についてに取得する場合 Analysis Services も提供と呼ばれる、HTML ビューアー、 汎用コンテンツ ツリー ビューアー, 、モデルのデータと半表形式で検出されたパターンに関する詳細情報を表示します。 詳細については、「Microsoft 汎用コンテンツ ツリー ビューアーを使用したモデルの参照」をご覧ください。
このレッスンでは、3 つのモデルを使用して結果を観察します。 モデルの種類ごとに、基になるアルゴリズムが異なり、データの検証方法も異なります。
デシジョン ツリー モデルでは、自転車の購入に影響を与える要因がわかります。
クラスター モデルでは、自転車の購買行動を含む属性やその他の任意の属性ごとに顧客をグループ化できます。
Naive Bayes モデルでは、さまざまな属性間のリレーションシップを検証できます。
各マイニング モデル ビューアーの詳細については、次のトピックを参照してください。
使用して 3 つのモデルを表示できる、 汎用コンテンツ ツリー ビューアー, 、数式やデータ値などを抽出します。
このレッスンの最初の作業
デシジョン ツリー モデルと #40; の表示基本的なデータ マイニングのチュートリアルと #41 です。
前のレッスン
次のレッスン
レッスン 5: テストのモデルと #40 です。基本的なデータ マイニングのチュートリアルと #41 です。