中級者向けデータ マイニング チュートリアル (Analysis Services - データ マイニング)
Microsoft Analysis Services には、データ マイニング モデルを作成して操作するための統合環境が用意されています。 データ ソースへのバインド、同じデータでの複数のモデルの作成とテスト、および予測分析で使用するモデルの配置を簡単に行うことができます。
基本的なデータ マイニング チュートリアルでは、SQL Server Data Tools (SSDT) を使用してデータ マイニング ソリューションを作成する方法を学習しました。また、顧客の購入行動を分析し、潜在的な購入者をターゲットにするためのターゲットメーリング キャンペーンをサポートする 3 つのモデルを構築しました。
この中級者向けチュートリアルでは、この使用経験があることを前提に、予測分析やマーケット バスケット分析などの一般的なビジネス要件を含むいくつかの新しいシナリオを紹介します。 そして、時系列モデル、アソシエーション モデル、およびシーケンス クラスター モデルの作成方法を学習します。 最後に、ニューラル ネットワークを使用してデータの相関関係を調べ、ロジスティック回帰を使用して予測を行う方法を学習します。
レッスンは互いに独立しており、個別に実行できます。
次のチュートリアルを完了するには、データ マイニング ツールと、基本的なデータ マイニング チュートリアルで導入されたマイニング モデル ビューアーについて理解しておく必要があります。
すべてのシナリオで AdventureWorksDW2012 データ ソースが使用されますが、シナリオごとに異なるデータ ソース ビューを作成します。 データ ソースを最初に作成すれば、後はどの順序でレッスンを進めてもかまいません。
レッスンのシナリオ
絞り込みメール配信キャンペーンの成功を受けて、データ マイニングの知識を活かしてビジネス プランニングに使用する新しいモデルを開発するように依頼されました。 これには、次のタスクが含まれます。
予測: 時系列 モデルを 作成して、世界中のさまざまな地域の製品の売上を予測します。 各リージョンの個々のモデルを開発し、 クロス予測の使用方法を学習します。
市場バスケット分析:関連付けモデルを作成して、Adventure Works Cycles e コマース サイトへの訪問中に購入された製品のグループを分析します。 このマーケット バスケット モデルに基づいて、顧客に製品を推奨できます。
シーケンス分析: 顧客が製品を購入する順序を分析するために、 シーケンス クラスタリング モデルを構築します。 このモデルに基づいて、Web サイト デザインの変更や新たな製品のオファーを計画することができます。
因子分析:ニューラル ネットワーク モデルを使用して、コール センター データのサービス品質が低下する原因を調べることができます。 予備モデルからの分析情報に基づいて、カスタマー エクスペリエンスを向上させる戦略を予測する ロジスティック回帰モデル を作成します。
学習する内容
このチュートリアルでは、複数種類のデータ マイニング アルゴリズムの作成方法と使用方法を説明します。 このチュートリアルは次のレッスンで構成されています。
レッスン 1: 中級者向けデータ マイニング ソリューションの作成 (中級者向けデータ マイニング チュートリアル)
このレッスンでは、 AdventureWorksDW2012 データベースに基づいて新しいプロジェクトを作成し、いくつかの新しいデータ ソース ビューとその他の多くのマイニング モデルをサポートします。
レッスン 2: 予測シナリオの作成 (中級者向けデータ マイニング チュートリアル)
このレッスンでは、予測シナリオの一部として使用できるマイニング モデルを作成します。 また、Microsoft Time Series アルゴリズムを使用して構築されたマイニング モデルについても調べていきます。
個々の地域向けのモデルを作成した後に、クロス予測に使用できる汎用モデルを作成します。
レッスン 3: マーケット バスケット シナリオの作成 (中級者向けデータ マイニング チュートリアル)
このレッスンでは、新しいデータ ソース ビューを追加し、入れ子になったテーブルとキーを操作する方法について学習します。 このデータを基に、マーケット バスケット シナリオの一部として使用できるマイニング モデルを作成します。 また、Microsoft Association アルゴリズムを使用して構築されたマイニング モデルについても調べていきます。
レッスン 4: シーケンス クラスター シナリオの作成 (中級者向けデータ マイニング チュートリアル)
このレッスンでは、シーケンス クラスター シナリオの一部として使用できるマイニング モデルを作成します。 また、Microsoft シーケンス クラスタリング アルゴリズムを使用して構築されたマイニング モデルを調べる方法についても説明します。
レッスン 5: ニューラル ネットワークおよびロジスティック回帰モデルの作成 (中級者向けデータ マイニング チュートリアル)
このレッスンでは、Microsoft ニューラル ネットワーク アルゴリズムおよび Microsoft ロジスティック回帰アルゴリズムを使用して、関連するいくつかのマイニング モデルを作成します。 また、データ ソース ビューを操作して、モデルの基になるデータを調査する方法についても学習します。
要件
次のソフトウェアがインストールされていることを確認してください。
Microsoft SQL Server 2014
Microsoft SQL Server Analysis Services
AdventureWorksDW2012 データベースを使用してSQL Serverします。
セキュリティ強化のため、既定ではサンプル データベースがインストールされません。 Microsoft SQL Serverの公式データベースをインストールするには、Microsoft SQL サンプル データベース ページにアクセスし、サンプル データベースの適切なバージョンを選択します。
参照
基本的なデータ マイニング チュートリアル
Bike Buyer DMX のチュートリアル
マーケット バスケット DMX のチュートリアル