シーケンスクラスタリングモデルでの予測の作成 (中間データマイニングチュートリアル)

ビューアーで参照することでシーケンスクラスタリングモデルの理解を深めてから、データマイニングデザイナーの [ マイニングモデル 予測] タブで予測クエリビルダーを使用して予測クエリを作成できます。予測を作成するには、まずシーケンスクラスタリングモデルを選択してから、入力データを選択します。入力の場合は、外部データソースを使用することも、シングルトンクエリを作成してダイアログボックスに値を指定することもできます。

このレッスンでは、予測クエリビルダーの使用方法を既に理解しており、シーケンスクラスタリングモデルに固有のクエリを作成する方法を学習することを前提としています。予測クエリビルダーの使用方法に関する一般的な情報については、「データマイニングクエリインターフェイス」または「基本的なデータマイニング」チュートリアル「予測の作成 (基本的なデータマイニングチュートリアル)」のセクションを参照してください。

リージョンモデルでの予測の作成

このシナリオでは、最初にいくつかのシングルトン予測クエリを作成して、予測がリージョンによってどのように異なるかを把握します。

シーケンスクラスタリングモデルに対してシングルトンクエリを作成するには

データマイニングデザイナーの [ マイニングモデル予測 ] タブをクリックします。
[ マイニングモデル ] 列メニューで、[ シングルトンクエリ] を選択します。

[ マイニングモデル ] ウィンドウと [シングルトンクエリ入力 ] ウィンドウが表示されます。
[ マイニングモデル ] ウィンドウで、[ モデルの選択] をクリックします。 (シーケンスクラスタリングモードが既に選択されている場合は、この手順をスキップできます)。

[ マイニングモデルの選択 ] ダイアログボックスが開きます。
マイニング構造を表すノードを展開 します。[リージョンを使用したシーケンスクラスタリング] を選択し、Region を使用したモデル シーケンスクラスタリングを選択します。 OK をクリックします。ここでは、入力ウィンドウを無視します。予測関数を設定した後、入力を指定します。
グリッドで、[ ソース ] の下にある空のセルをクリックし、[ 予測関数 ] を選択します。[ フィールド] のセルで、[ PredictSequence] を選択します。

注

Predict 関数を使用することもできます。その場合は、テーブル列を引数として受け取る Predict 関数のバージョンを必ず選択してください。
[マイニングモデル] ウィンドウで、入れ子になったテーブル v Assoc Seq Line Itemsを選択し、それをグリッドにドラッグして、PredictSequence 関数の [抽出条件/引数] ボックスにドラッグします。

テーブル名と列名をドラッグアンドドロップすると、構文エラーなしで複雑なステートメントを作成できます。ただし、 PredictSequence 関数の他の省略可能な引数を含む、セルの現在の内容を置き換えます。他の引数を表示するには、関数の 2 番目のインスタンスを参照用のグリッドに一時的に追加します。
予測クエリビルダーの右上隅にある [ 結果 ] ボタンをクリックします。

予想される結果には、式という見出しを持つ 1 つの列が含まれます。式列には、次の 3 つの列を含む入れ子になったテーブルが含まれています。

$SEQUENCE	行番号	モデル
1		Mountain-200

これらの結果はどういう意味ですか? 入力を指定しなかったことに注意してください。そのため、予測はケースの母集団全体に対して行われ、Analysis Services は最も可能性の高い予測全体を返します。

シングルトン予測クエリへの入力の追加

これまでは、入力を指定していません。次のタスクでは、[ Singleton Query Input]$シングルトンクエリ入力 $ ペインを使用して、クエリへの入力をいくつか指定します。まず、[Region] をリージョンシーケンスクラスタリングモデルへの入力として使用して、予測されたシーケンスがすべてのリージョンで同じかどうかを判断します。次に、各予測の確率を追加するようにクエリを変更し、結果をフラット化して表示しやすくする方法について説明します。

特定の顧客グループの予測を生成するには

予測クエリビルダーの左上隅にある [デザイン ] ボタンをクリックして、クエリ作成グリッドに戻ります。
[シングルトンクエリ入力] ダイアログボックスで、Regionの [値] ボックスをクリックし、[ヨーロッパ] を選択します。
[ 結果 ] ボタンをクリックして、ヨーロッパのお客様の予測を表示します。
予測クエリビルダーの左上隅にある [デザイン ] ボタンをクリックして、クエリ作成グリッドに戻ります。
[シングルトンクエリ入力] ダイアログボックスで、Regionの [値] ボックスをクリックし、[北米] を選択します。
[ 結果 ] ボタンをクリックして、北米の顧客の予測を表示します。

カスタム式を使用して確率を加算する

確率は予測の属性であり、入れ子になったテーブルとして出力されるため、各予測の確率を出力する方が少し複雑になります。データマイニング拡張機能 (DMX) に慣れている場合は、クエリを簡単に変更して、入れ子になったテーブルにサブ select ステートメントを追加できます。ただし、カスタム式を追加することで、予測クエリビルダーでサブ select ステートメントを作成することもできます。

カスタム式を使用して予測シーケンスの確率を出力するには

予測クエリビルダーの左上隅にある [デザイン ] ボタンをクリックして、クエリ作成グリッドに戻ります。
グリッドの [ ソース] で新しい行をクリックし、[ カスタム式] を選択します。
[フィールド] の下のボックスは空白のままにします。
[ エイリアス] に「 t」と入力します。
次のコードサンプルに示すように、[ 抽出条件/引数 ] ボックスに、完全なサブ select ステートメントを入力します。開始かっこと終了かっこを必ず含めます。
```
(SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))  
```
[ 結果 ] ボタンをクリックして、ヨーロッパのお客様の予測を表示します。

結果には、2 つの入れ子になったテーブルが含まれるようになりました。1 つは予測あり、もう 1 つは予測の確率を持ちます。クエリが機能しない場合は、クエリデザインビューに切り替えて、完全なクエリステートメントを確認できます。これは次のようになります。

SELECT  
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
FROM  
  [Sequence Clustering with Region]  
NATURAL PREDICTION JOIN  
(SELECT 'Europe' AS [Region]) AS t

結果の取り扱い

結果に入れ子になったテーブルが多数ある場合は、表示しやすくするために結果をフラット化できます。これを行うには、クエリを手動で変更し、 FLATTENED キーワードを追加します。

予測クエリで入れ子になった行セットをフラット化するには

予測 クエリ ビルダーの隅にある [クエリ] ボタンをクリックします。

グリッドが開いているペインに変わり、予測クエリビルダーによって作成された DMX ステートメントを表示および変更できます。

SELECT キーワードの後に、「FLATTENED」と入力します。

クエリの完全なテキストは、次のようになります。

SELECT FLATTENED  
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
FROM  
  [Sequence Clustering with Region]  
NATURAL PREDICTION JOIN  
(SELECT 'Europe' AS [Region]) AS t

予測クエリビルダーの右上隅にある [ 結果 ] ボタンをクリックします。

クエリを手動で編集した後は、変更を失わずにデザインビューに切り替えることができません。ただし、手動で作成した DMX ステートメントをテキストファイルに保存し、デザインビューに戻すことができます。この操作を行うと、クエリはデザインビューで有効だった最後のバージョンに戻ります。

前の例では、モデルがリージョン間の違いを見つけたかどうかを知ることに関心があったため、シングルトン予測クエリへの入力としてケーステーブル列 Region を使用しました。ただし、モデルを調査した後、リージョン別の製品の推奨事項のカスタマイズを正当化するのに十分な違いが強くないと判断しました。予測に本当に関心があるのは、顧客が選択する項目です。そのため、次のクエリでは、リージョンを含まないシーケンスクラスタリングモデルを使用して、すべての顧客に対する推奨事項を生成します。

入れ子になったテーブル列を入力として使用する

まず、1 つの項目を入力として受け取り、次に最も可能性の高い項目を返すシングルトン予測クエリを作成します。この種類の予測を取得するには、入れ子になったテーブル列を入力値として使用する必要があります。これは、予測する属性 Model が入れ子になったテーブルの一部であるためです。 Analysis Services には、[ 入れ子になったテーブル入力 ] ダイアログボックスが用意されており、予測クエリビルダーを使用して、入れ子になったテーブル属性に対して予測クエリを簡単に作成できます。

入れ子になったテーブルを予測の入力として使用するには

予測クエリビルダーの左上隅にある [デザイン ] ボタンをクリックして、クエリ作成グリッドに戻ります。
[シングルトンクエリ入力] ダイアログボックスで、Regionの [値] ボックスをクリックし、空の行を選択してこのフィールドの入力をクリアします。
[シングルトンクエリ入力] ダイアログボックスで、vAssocSeqLineItemsの [値] ボックスをクリックし、[(...)] ボタンをクリックします。
「入れ子になったテーブル入力」ダイアログボックスで、「追加」をクリックします。
新しい行で、[ Model] の下のボックスをクリックし、一覧から [ツーリングタイヤ] を選択します。 OK をクリックします。
[ 結果 ] ボタンをクリックして予測を表示します。

このモデルでは、最初のアイテムとして[ツーリングタイヤ]を選択したすべてのお客様に対して、次の項目を推奨します。あなたは、モデルを探索して、顧客が頻繁にツーリングタイヤとツーリングタイヤチューブを一緒に購入することを知っているので、これらの推奨事項は良さそうです。

$SEQUENCE	行番号	モデル
1		ツーリング用タイヤチューブ
2		Sport-100
3		Long-Sleeve ロゴジャージー

入れ子になったテーブル入力を使用した一括予測クエリの作成

これで、推奨事項の作成に使用できる予測の種類がモデルによって作成されることに満足しました。次に、外部データソースにマップされる予測クエリを作成します。そのデータソースは、現在の製品を表す値を提供します。顧客 ID と製品の一覧を入力として提供する予測クエリを作成することに関心があるため、顧客テーブルをケーステーブルとして追加し、購入テーブルを入れ子になったテーブルとして追加します。次に、前に推奨事項を作成したとおりに予測関数を追加します。

これは、レッスン 3 でマーケットバスケットシナリオの予測を作成する場合と同じ手順です。ただし、シーケンスクラスタリングモデルの予測では、入力としての順序も必要です。

入れ子になったテーブル入力を使用して予測クエリを作成するには

[ マイニングモデル ] ウィンドウで、[シーケンスクラスターモデル] を選択します (まだ選択されていない場合)。
[ 入力テーブルの選択 ] ダイアログボックスで、[ ケーステーブルの選択] をクリックします。
[ テーブルの選択 ] ダイアログボックスの [データソース] で、[注文] を選択します。 [テーブル/ビュー名] ボックスの一覧で vAssocSeqOrders を選択し、[OK] をクリックします。
[ 入力テーブルの選択 ] ダイアログボックスで、[ 入れ子になったテーブルの選択] をクリックします。
[ テーブルの選択 ] ダイアログボックスの [ データソース] で、[注文] を選択します。 [テーブル/ビュー名] ボックスの一覧で [vAssocSeqLineItems] を選択し、[OK] をクリックします。

Analysis Services は、データ型が一致し、列名が似ている場合に、リレーションシップを検出して自動的に作成しようとします。作成したリレーションシップが間違っている場合は、結合線を右クリックして [接続の変更 ] を選択して列マッピングを編集するか、結合行を右クリックして [削除 ] を選択してリレーションシップを完全に削除できます。この場合、テーブルは既にデータソースビューに結合されているため、これらのリレーションシップはデザインウィンドウに自動的に追加されます。
グリッドに新しい行を追加します。 [ソース] で [vAssocSeqOrders] を選択し、[フィールド] で CustomerKey を選択します。
グリッドに新しい行を追加します。 [ソース] で [予測関数] を選択し、[フィールド] で PredictSequence を選択します。
vAssocSeqLineItems を 条件/引数 ボックスにドラッグします。 [ 抽出条件/引数 ] ボックスの末尾をクリックし、次の引数を入力します: 2。

[ 抽出条件/引数 ] ボックスの完全なテキストは次のようになります。 [Sequence Clustering].[v Assoc Seq Line Items],2
[ 結果 ] ボタンをクリックして、各顧客の予測を表示します。

シーケンスクラスタリングモデルに関するチュートリアルを完了しました。

次のステップ

中間データマイニングチュートリアル (Analysis Services - データマイニング) のすべてのセクションを完了した場合は、次の手順として、データマイニング拡張機能 (DMX) ステートメントを使用してモデルを構築し、予測を生成する方法を学習します。詳細については、「 DMX を使用したデータマイニングモデルの作成とクエリ: チュートリアル (Analysis Services - データマイニング)」を参照してください。

プログラミングの概念に慣れている場合は、Analysis Management オブジェクト (AMO) を使用して、データマイニングオブジェクトをプログラムで操作することもできます。詳細については、「 AMO データマイニングクラス」を参照してください。

こちらもご覧ください

シーケンスクラスタリングモデルクエリの例
 シーケンスクラスタリングモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)

Last updated on 2017-03-08