シーケンス クラスター マイニング モデル構造の作成 (中級者向けデータ マイニング チュートリアル)
対象: SQL Server 2016 Preview
シーケンス クラスター マイニング モデルを作成する最初の手順では、データ マイニング ウィザードを使用して新しいマイニング構造を作成し、Microsoft シーケンス クラスター アルゴリズムに基づくマイニング モデルを作成します。
マーケット バスケット分析に使用したのと同じデータ ソース ビューを使用するされますを含む列を追加、 シーケンス 識別子。 このシナリオでは、シーケンスは、顧客が品目を買い物かごに追加した順序を表します。
統計データによって顧客を分類するためにいずれかのモデルで使用する列も追加します。
シーケンス クラスターの構造とモデルを作成するには
ソリューション エクスプ ローラーで SQL Server Data Tools (SSDT), を右クリックして マイニング構造 選択 新しいマイニング構造します。
[データ マイニング ウィザードへようこそ] ページで [次へ] をクリックします。
定義方法の選択 いることを確認] ページで、 既存のリレーショナル データベースまたはデータ ウェアハウスから クリックして選択すると、 次します。
データ マイニング構造の作成 いることを確認] ページで、オプション マイニング モデルを含むマイニング構造の作成 が選択されています。 次に、オプションで、ドロップダウン リストをクリックして を使用するデータ マイニング技法を指定?, を選択し、 Microsoft シーケンス クラスターします。 **[次へ]**をクリックします。
[データ ソース ビュー ページが表示されます。 利用可能なデータ ソース ビュー, [ 注文します。
Orders は、マーケット バスケット シナリオで使用したものと同じデータ ソース ビューです。 このデータ ソース ビューを作成していない場合は、次を参照してください。 [入れ子になったテーブルと #40; 中級者向けデータ マイニング チュートリアル ) データ ソース ビューの追加](../Topic/Adding%20a%20Data%20Source%20View%20with%20Nested%20Tables%20(Intermediate%20Data%20Mining%20Tutorial).md)します。
**[次へ]**をクリックします。
テーブルの種類の指定 ] ページで、[、 ケース ] の横のチェック ボックス、 vAssocSeqOrders テーブル、および選択、 入れ子になった ] の横のチェック ボックス、 vAssocSeqLineItems テーブルです。 **[次へ]**をクリックします。
> [!NOTE]
> 選択すると、エラーが発生した場合、 **ケース** または **入れ子になった** チェック ボックスがあります、データ ソース ビュー内の結合が正しくないことです。 入れ子になったテーブル **vAssocSeqLineItems**, 、ケース テーブルに接続する必要があります **vAssocSeqOrders** 多対一結合によってです。 結合線を右クリックして結合の方向を逆向きにすることによって、リレーションシップを編集できます。 詳細については、次を参照してください。 [作成またはリレーションシップの編集] ダイアログ ボックスと #40 です。Analysis Services - 多次元データと #41;](../Topic/Create%20or%20Edit%20Relationship%20Dialog%20Box%20(Analysis%20Services%20-%20Multidimensional%20Data).md)します。
- トレーニング データの指定 ページで、次のようにチェック ボックスを選択して、モデルで使用する列を選択します。
- **IncomeGroup**選択、 **入力** チェック ボックスをオンします。
この列には、クラスタリングに使用できる、顧客に関する有用な情報が格納されます。 最初のモデルではこの情報を使用し、2 番目のモデルではこの情報を無視します。
- **OrderNumber**選択、 **キー** チェック ボックスをオンします。
このフィールドは、ケース テーブルの識別子として使用されますか **キー**します。 一般に、キーにはクラスタリングに適さない一意の値が格納されるので、ケース テーブルのキー フィールドは入力として使用しないでください。
- **地域**選択、 **入力** チェック ボックスをオンします。
この列には、クラスタリングに使用できる、顧客に関する有用な情報が格納されます。 最初のモデルではこの情報を使用し、2 番目のモデルではこの情報を無視します。
- **LineNumber**選択、 **キー** と **入力** のチェック ボックスです。
**LineNumber** 識別子として使用するフィールドを入れ子になったテーブルまたは **シーケンス キー**します。 入れ子になったテーブルのキーは、常に入力に使用する必要があります。
- **モデル**選択、 **入力** と **予測可能** のチェック ボックスです。
選択内容が正しいことを確認] をクリックし、 **次**します。
- 指定列のコンテンツおよびデータ型 ] ページで、グリッドには、列、コンテンツの種類、および次の表に示されるデータ型が含まれていることを確認してをクリックし、 次します。
|テーブルまたは列|コンテンツの種類|データ型|
|-------------------|----------------|-------------|
|IncomeGroup|Discrete|テキスト|
|OrderNumber|[キー]|テキスト|
|Region|Discrete|テキスト|
|vAssocSeqLineItems|||
|Line Number|Key Sequence|Long|
|[モデル]|Discrete|テキスト|
テスト セットの作成 ] ページで、変更、 テスト用データの割合 20、およびをクリックする 次します。
ウィザードの完了 ] ページでの マイニング構造名, 、型 Sequence Clustering with Regionします。
マイニング モデル名, 、型 Sequence Clustering with Regionします。
チェック、 ドリルスルーを許可する ボックスをクリックして 完了します。