次の方法で共有


シーケンス クラスタリング マイニング モデル構造の作成 (中間データ マイニング チュートリアル)

シーケンス クラスタリング マイニング モデルを作成する最初の手順は、データ マイニング ウィザードを使用して、Microsoft シーケンス クラスタリング アルゴリズムに基づいて新しいマイニング構造とマイニング モデルを作成することです。

マーケット バスケット分析に使用したのと同じデータ ソース ビューを使用しますが、 sequence 識別子を含む列を追加します。 このシナリオでは、シーケンスとは、顧客が買い物かごに品目を追加した順序を意味します。

また、いずれかのモデルで使用される列を追加して、人口統計別に顧客をグループ化します。

シーケンス クラスタリング構造とモデルを作成するには

  1. SQL Server Data Tools (SSDT) のソリューション エクスプローラーで、[ マイニング構造 ] を右クリックし、[ 新しいマイニング構造] を選択します。

  2. [ データ マイニング ウィザードへようこそ ] ページで、[ 次へ] をクリックします。

  3. [ 定義方法の選択] ページで、[ 既存のリレーショナル データベースまたはデータ ウェアハウスから ] が選択されていることを確認し、[ 次へ] をクリックします。

  4. [ データ マイニング構造の作成 ] ページで、[ マイニング モデルを使用してマイニング構造を作成 する] オプションが選択されていることを確認します。 次に、オプションのドロップダウン リストをクリックし、[ どのデータ マイニング手法を使用しますか?] をクリックし、[ Microsoft シーケンス クラスタリング] を選択します。 [次へ] をクリックします。

    [ データ ソース ビューの選択] ページが表示されます。 [ 使用可能なデータ ソース ビュー] で、[ Ordersを選択します。

    注文は、マーケット バスケット シナリオで使用したのと同じデータ ソース ビューです。 このデータ ソース ビューを作成していない場合は、「 入れ子になったテーブルを含むデータ ソース ビューの追加 (中間データ マイニング チュートリアル)」を参照してください。

  5. [次へ] をクリックします。

  6. [テーブルの種類の指定] ページで、vAssocSeqOrders テーブルの横にある ケース チェックボックスをオンにし、vAssocSeqLineItems テーブルの横にある ネスト チェックボックスをオンにします。 [次へ] をクリックします。

    [ケース] または [入れ子] チェック ボックスを選択したときにエラーが発生した場合、データ ソース ビューの結合が正しくない可能性があります。 入れ子になったテーブル vAssocSeqLineItems は、多対一結合によって case テーブル vAssocSeqOrders に接続されている必要があります。 結合線を右クリックし、結合の方向を反転することで、リレーションシップを編集できます。 詳細については、「リレーションシップの 作成または編集」 ダイアログ ボックス (Analysis Services - 多次元データ) を参照してください。

  7. [ トレーニング データの指定] ページで、次のようにチェック ボックスをオンにして、モデルで使用する列を選択します。

    • IncomeGroup [ 入力 ] チェック ボックスをオンにします。

      この列には、クラスタリングに使用できる顧客に関する興味深い情報が含まれています。 最初のモデルで使用し、2 番目のモデルでは無視します。

    • OrderNumber [ Key ] チェック ボックスをオンにします。

      このフィールドは、ケース テーブルまたは Keyの識別子として使用されます。 一般に、ケース テーブルのキー フィールドは入力として使用しないでください。これは、キーにクラスタリングに役立たない一意の値が含まれているためです。

    • 地域 [ 入力 ] チェック ボックスをオンにします。

      この列には、クラスタリングに使用できる顧客に関する興味深い情報が含まれています。 最初のモデルで使用し、2 番目のモデルでは無視します。

    • LineNumber [ Key ] チェック ボックスと [ 入力] チェック ボックスをオンにします。

      LineNumber フィールドは、入れ子になったテーブルまたはSequence Keyの識別子として使用されます。 入れ子になったテーブルのキーは、常に入力に使用する必要があります。

    • モデル [ 入力 ] チェック ボックスと [ 予測可能] チェック ボックスをオンにします。

    選択内容が正しいことを確認し、[ 次へ] をクリックします。

  8. [ 列のコンテンツとデータ型の指定 ] ページで、次の表に示す列、コンテンツ タイプ、およびデータ型がグリッドに含まれていることを確認し、[ 次へ] をクリックします。

    テーブル/列 コンテンツ タイプ データ型
    所得層 ディスクリート テキスト
    OrderNumber テキスト
    リージョン ディスクリート テキスト
    vAssocSeqLineItems
    行番号 キー シーケンス 長い
    モデル ディスクリート テキスト
  9. [ テスト セットの作成 ] ページで、テスト のデータの割合 を 20 に変更し、[ 次へ] をクリックします。

  10. [ ウィザードの完了 ] ページで、[ マイニング構造名] に「 Sequence Clustering with Region」と入力します。

  11. [マイニング モデル名] に「Sequence Clustering with Region」と入力します。

  12. [ ドリルスルーを許可する ] ボックスをオンにし、[ 完了] をクリックします。

このレッスンの次の作業

シーケンス クラスタリング モデルの処理

こちらもご覧ください

データ マイニング デザイナー
Microsoft シーケンス クラスタリング アルゴリズム