シーケンス クラスタ マイニング モデル構造の作成 (中級者向けデータ マイニング チュートリアル)
シーケンス クラスタ マイニング モデルを作成する最初の手順では、データ マイニング ウィザードを使用して新しいマイニング構造を作成し、Microsoft シーケンス クラスタ アルゴリズムに基づくマイニング モデルを作成します。
マーケット バスケット分析に使用したものと同じデータ ソース ビューを使用しますが、sequence ID を格納する列を追加します。このシナリオでは、シーケンスは、顧客が品目を買い物かごに追加した順序を表します。
統計データによって顧客を分類するためにいずれかのモデルで使用する列も追加します。
シーケンス クラスタの構造とモデルを作成するには
Business Intelligence Development Studio のソリューション エクスプローラで、[マイニング構造] を右クリックして [新しいマイニング構造] をクリックします。
[データ マイニング ウィザードへようこそ] ページで [次へ] をクリックします。
[定義方法の選択] ページで [既存のリレーショナル データベースまたはデータ ウェアハウスを使用する] が選択されていることを確認し、[次へ] をクリックします。
[データ マイニング構造の作成] ページで [マイニング モデルを含むマイニング構造を作成する] オプションが選択されていることを確認します。次に、[使用するデータ マイニング技法を指定してください。] オプションのドロップダウン リストをクリックし、[Microsoft シーケンス クラスタ] を選択します。[次へ] をクリックします。
[データ ソース ビューの選択] ページが表示されます。[使用できるデータ ソース ビュー] で [Orders] を選択します。
Orders は、マーケット バスケット シナリオで使用したものと同じデータ ソース ビューです。このデータ ソース ビューを作成していない場合は、「入れ子になったテーブルを伴うデータ ソース ビューの追加 (中級者向けデータ マイニング チュートリアル)」を参照してください。
[次へ] をクリックします。
[テーブルの種類の指定] ページで、vAssocSeqOrders テーブルの横にある [ケース] チェック ボックスをオンにし、vAssocSeqLineItems テーブルの横の [入れ子] チェック ボックスをオンにします。[次へ] をクリックします。
注意 [ケース] または [入れ子] チェック ボックスの選択時にエラーが発生する場合は、データ ソース ビューの結合が正しくない可能性があります。入れ子になったテーブル vAssocSeqLineItems は、ケース テーブル vAssocSeqOrders に多対一結合で接続する必要があります。結合線を右クリックして結合の方向を逆向きにすることによって、リレーションシップを編集できます。詳細については、「[リレーションシップの作成]/[リレーションシップの編集] ダイアログ ボックス (Analysis Services - 多次元データ)」を参照してください。
[トレーニング データの指定] ページで、次のようにチェック ボックスをオンにして、モデルで使用する列を選択します。
IncomeGroup [入力] チェック ボックスをオンにします。
この列には、クラスタリングに使用できる、顧客に関する有用な情報が格納されます。最初のモデルではこの情報を使用し、2 番目のモデルではこの情報を無視します。
OrderNumber [キー] チェック ボックスをオンにします。
このフィールドは、ケース テーブルの識別子、つまり Key として使用されます。一般に、キーにはクラスタリングに適さない一意の値が格納されるので、ケース テーブルのキー フィールドは入力として使用しないでください。
Region [入力] チェック ボックスをオンにします。
この列には、クラスタリングに使用できる、顧客に関する有用な情報が格納されます。最初のモデルではこの情報を使用し、2 番目のモデルではこの情報を無視します。
LineNumber [キー] チェック ボックスと [入力] チェック ボックスをオンにします。
LineNumber フィールドは、入れ子になったテーブルの識別子、つまり Sequence Key として使用されます。入れ子になったテーブルのキーは、常に入力に使用する必要があります。
Model [入力] チェック ボックスと [予測可能] チェック ボックスをオンにします。
選択内容が正しいことを確認して、[次へ] をクリックします。
[列のコンテンツおよびデータ型の指定] ページで、次の表に示す列、コンテンツの種類、およびデータ型がグリッドにあることを確認して、[次へ] をクリックします。
テーブルまたは列
コンテンツの種類
データ型
IncomeGroup
Discrete
Text
OrderNumber
Key
Text
Region
Discrete
Text
vAssocSeqLineItems
Line Number
Key Sequence
Long
Model
Discrete
Text
[テスト セットの作成] ページで、[テスト用データの割合] を 20 に変更し、[次へ] をクリックします。
[ウィザードの完了] ページの [マイニング構造名] に「Sequence Clustering with Region」と入力します。
[マイニング モデル名] に「Sequence Clustering with Region」と入力します。
[ドリルスルーを許可する] チェック ボックスをオンにして、[完了] をクリックします。