基本的なデータ マイニング チュートリアル
Microsoft Analysis Services の基本的なデータ マイニング チュートリアルへようこそ。 Microsoft SQL Server は、データ マイニング モデルを作成し、予測を行う統合環境を提供します。 このチュートリアルでは、機械学習を使用して顧客の購買行動を分析および予測することで、絞り込みメール配信キャンペーンのためのシナリオを完成させます。 このチュートリアルでは、クラスタリング、デシジョン ツリー、Naive Bayes (ナイーブ ベイズ) という非常に重要な 3 つのデータ マイニング アルゴリズムを使用する方法を示します。 また、マイニング モデル ビューアーを使用して結果を分析する方法と、Microsoft SQL Server Analysis Servicesに含まれているデータ マイニング ツールを使用して予測と精度グラフを作成する方法についても説明します。 架空の会社である Adventure Works Cycles は、すべての例に使用されます。
データ マイニング ツールを使い慣れた場合は、 中間データ マイニング チュートリアル (Analysis Services - データ マイニング) も完了することをお勧めします。 これらのレッスンでは、予測、マーケット バスケット分析、タイム シリーズ (時系列)、アソシエーション モデル、入れ子になったテーブル、およびシーケンス クラスターの使用方法を示します。
チュートリアルのシナリオ
このチュートリアルでは、Adventure Works Cycles の従業員であり、過去の購入に基づいて会社の顧客の詳細を学習し、その履歴データを使用してマーケティングで使用できる予測を行います。 会社はこれまでデータ マイニングを行ったことがなかったので、データ マイニング専用の新しいデータベースを作成し、データ マイニング モデルを設定する必要があります。
学習する内容
このチュートリアルでは、さまざまな種類の機械学習メソッドの作成方法と使用方法を説明します。 また、マイニング モデルのコピーを作成し、入力データにフィルターを適用してさまざまな結果を取得する方法も学習します。 その後、リフト チャートを使用して、両方のモデルの結果を比較できます。 最後に、ドリルスルーを使用して、基になるマイニング構造から詳細なデータを取得します。
Microsoft Analysis Services データ マイニングには、複数の予測モデルを簡単に開発および比較し、結果に対してアクションを実行するのに役立つ次の機能が含まれています。
ホールドアウト テスト セット -マイニング構造を作成するときに、マイニング構造内のデータをトレーニング セットとテスト セットに分割できるようになりました。 これにより、類似のデータ セットに対してモデルをテストし、関連するモデルの精度を比較できます。
マイニング モデル フィルター -マイニング モデルにフィルターをアタッチし、トレーニングとテストの両方でフィルターを適用できるようになりました。 これにより、データの異なるサブセットに対して関連モデルを簡単に構築できます。
構造ケースと構造列へのドリルスルー - マイニング モデルの一般的なパターンから、データ ソースの操作可能な詳細に簡単に移動できるようになりました。
このチュートリアルは次のレッスンで構成されています。
レッスン 1: Analysis Services データベースの準備 (基本的なデータ マイニング チュートリアル)
このレッスンでは、新しい Analysis Services データベースを作成し、データ ソースとデータ ソース ビューを追加し、データ マイニングで使用する新しいデータベースを準備する方法について説明します。
レッスン 2: 絞り込みメール配信構造の作成 (基本的なデータ マイニング チュートリアル)
このレッスンでは、絞り込みメール配信シナリオの一部として使用できるマイニング モデル構造の作成方法を学習します。
レッスン 3: モデルの追加と処理
このレッスンでは、構造にモデルを追加する方法を学習します。 モデルの作成には、次のアルゴリズムを使用します。
Microsoft デシジョン ツリー
Microsoft クラスタリング
Microsoft Naive Bayes
レッスン 4: 絞り込みメール配信モデルの検証 (基本的なデータ マイニング チュートリアル)
このレッスンでは、ビューアーを使用して各モデルの結果を調査および解釈する方法を学習します。
レッスン 5: モデルのテスト (基本的なデータ マイニング チュートリアル)
このレッスンでは、いずれかの絞り込みメール配信モデルのコピーを作成し、トレーニング データを制限するためのマイニング モデル フィルターを特定の顧客のセットに追加し、モデルの実行可能性を評価します。
レッスン 6: 予測の作成と操作 (基本的なデータ マイニング チュートリアル)
「基本的なデータ マイニング チュートリアル」の最後のレッスンでは、モデルを使用して、自転車を購入する可能性が最も高い顧客を予測します。 次に、基になるケースをドリルスルーして連絡先情報を取得します。
要件
次のソフトウェアがインストールされていることを確認してください。
Microsoft SQL Server 2014
Microsoft SQL Server Analysis Services多次元モード
AdventureWorksDW2012 データベース。
セキュリティを強化するために、サンプル データベースはSQL Serverと共にインストールされません。 Microsoft SQL Serverの公式データベースをインストールするには、Microsoft SQL サンプル データベース ページにアクセスし、[SQL Server 2014] を選択します。
注意
チュートリアルを進める際に、[ 次のトピック ] ボタンと [ 前のトピック ] ボタンをドキュメント ビューアー ツール バーに追加すると、手順間を簡単に移動できる場合があります。
参照
データ マイニング ソリューション
マイニング モデル タスクと操作方法
DMX を使用したデータ マイニング モデルの作成とクエリ : チュートリアル (Analysis Services - データ マイニング)