次の方法で共有


Market Basket 構造およびモデルの作成 (中級者向けデータ マイニング チュートリアル)

前の作業では、データ ソース ビューを作成しました。次の作業では、データ マイニング ウィザードを使用して、新しいマイニング構造を作成します。この作業では、Microsoft アソシエーション アルゴリズムに基づくマイニング構造とマイニング モデルを作成します。

注意

vAssocSeqLineItems テーブルを入れ子にできないことを示すエラーが表示された場合は、レッスンの前の作業に戻り、多対一の結合を確実に作成してください。この結合を作成するには、vAssocSeqLineItems テーブル ("多" の側) から vAssocSeqOrders テーブル ("一" の側) にドラッグします。結合線を右クリックして、テーブル間のリレーションシップを編集することもできます。

アソシエーション マイニング構造を作成するには

  1. Business Intelligence Development Studio のソリューション エクスプローラで、[マイニング構造] を右クリックし、[新しいマイニング構造] をクリックして、データ マイニング ウィザードを開きます。

  2. [データ マイニング ウィザードへようこそ] ページで [次へ] をクリックします。

  3. [定義方法の選択] ページで [既存のリレーショナル データベースまたはデータ ウェアハウスを使用する] が選択されていることを確認し、[次へ] をクリックします。

  4. [データ マイニング構造の作成] ページの [使用するデータ マイニング技法を指定してください] で、一覧から [Microsoft アソシエーション ルール] を選択し、[次へ] をクリックします。[データ ソース ビューの選択] ページが表示されます。

  5. [使用できるデータ ソース ビュー] で [注文] を選択し、[次へ] をクリックします。

  6. [テーブルの種類の指定] ページで、vAssocSeqLineItems テーブルの行の [入れ子] チェック ボックスと vAssocSeqOrders テーブルの行の [ケース] チェック ボックスをオンにします。[次へ] をクリックします。

  7. [トレーニング データの指定] ページで、オンになっているボックスをすべてオフにします。[OrderNumber] の横にある [キー] チェック ボックスをオンにして、ケース テーブル vAssocSeqOrders のキーを設定します。

    マーケット バスケット分析の目的は、単一のトランザクションに含まれる製品を特定することであるため、CustomerKey フィールドを使用する必要がありません。

  8. [Model] の横にある [キー] チェック ボックスをオンにして、入れ子テーブル vAssocSeqLineItems のキーを設定します。この操作を行うと、[入力] チェック ボックスも自動的にオンになります。Model[予測可能] チェック ボックスもオンにします。

    Market Basket モデルでは、買い物かごに商品が入れられる順序は問題にならないため、LineNumber を入れ子テーブルのキーとして含める必要はありません。順序が重要となるモデルでのみ、LineNumber をキーとして使用します。レッスン 4 では、Microsoft シーケンス クラスタ アルゴリズムを使用するモデルを作成します。

  9. [IncomeGroup] および [Region] の左側にあるチェック ボックスをオンにします。ただし、それ以外のチェック ボックスはオンにしないでください。これにより、これらの列が構造に追加され、後で参照できるようになります。ただし、これらの列はモデルでは使用されません。選択内容は以下のようになります。

    ダイアログ ボックスの状態

  10. [次へ] をクリックします。

  11. [列のコンテンツおよびデータ型の指定] ページで、選択内容が次の表に示す値と同じになっていることを確認して、[次へ] をクリックします。

    コンテンツの種類

    データ型

    IncomeGroup

    Discrete

    Text

    Order Number

    Key

    Text

    Region

    Discrete

    Text

    vAssocSeqLineItems

      

      

    Model

    Key

    Text

  12. [テスト セットの作成] ページの [テスト用データの割合] オプションの既定値は 30% です。この値を 0 に変更します。[次へ] をクリックします。

    注意

    「基本的なデータ マイニング チュートリアル」では、モデルの精度を測定するためのテスト セットを作成しました。Analysis Services には、リフト チャートや相互検証レポートなど、モデルの精度を測定するための手法が用意されていますが、これらは分類および推定のための手法です。結合型の予測には使用できません。

  13. [ウィザードの完了] ページで、[マイニング構造名] に「Association」と入力します。

  14. [マイニング モデル名] に「Association」と入力します。

  15. [ドリルスルーを許可する] オプションを選択し、[完了] をクリックします。

    データ マイニング デザイナが開き、作成した Association マイニング構造が表示されます。