絞り込みメール配信シナリオを作成するには、まず、Business Intelligence Development Studio のデータ マイニング ウィザードを使用して、新しいマイニング構造とデシジョン ツリー マイニング モデルを作成します。
詳細情報
データ マイニング ウィザード, データ マイニング デザイナ, Microsoft デシジョン ツリー アルゴリズム
絞り込みメール配信シナリオ用のマイニング構造を作成するには
ソリューション エクスプローラで [マイニング構造] を右クリックして、[新しいマイニング構造] をクリックします。
データ マイニング ウィザードが開きます。
[データ マイニング ウィザードへようこそ] ページで [次へ] をクリックします。
[定義方法の選択] ページで [既存のリレーショナル データベースまたはデータ ウェアハウスを使用する] が選択されていることを確認し、[次へ] をクリックします。
[データ マイニング技法の選択] ページで、[使用するデータ マイニング技法を指定してください] ボックスの一覧から [Microsoft デシジョン ツリー] を選択します。
このチュートリアルでは、この初期マイニング構造に基づいて複数のモデルを作成します。最初のモデルは、ウィザードの完了時にマイニング構造と共に作成され、Microsoft デシジョン ツリー アルゴリズムに基づきます。
[次へ] をクリックします。
[データ ソース ビューの選択] ページでは、既定で Adventure Works DW が選択されます。[参照] をクリックしてデータ ソース ビューのテーブルを表示した後、[閉じる] をクリックしてウィザードに戻ります。
[次へ] をクリックします。
[テーブルの種類の指定] ページで、vTargetMail テーブルの横の [ケース] チェック ボックスをオンにして、[次へ] をクリックします。
[トレーニング データの指定] ページで、CustomerKey の横にある [キー] チェック ボックスがオンになっていることを確認します。
データ ソース ビューのソース テーブルにキーが表示されていれば、その列がモデルのキーとして自動的に選択されます。
BikeBuyer 列の横にある [入力] チェック ボックスと [予測可能] チェック ボックスをオンにします。
列が予測可能であることを指定すると、[候補検索] ボタンが有効になります。[候補検索] をクリックすると [関連列の提示] ダイアログ ボックスが開き、予測可能列に関連性の高い列が一覧表示されます。
[関連列の提示] ダイアログ ボックスでは、予測属性との相関関係が深い順に属性が一覧表示されます。スコアが 0.05 より大きい列は、モデルに追加する対象として自動的に選択されます。提示内容を確認して [OK] をクリックします。選択した列が入力列として認識されます。このチュートリアルでは、[キャンセル] をクリックして提示を無視します。
次の列の横にある [入力] チェック ボックスをオンにします。
- Age
- CommuteDistance
- EnglishEducation
- EnglishOccupation
- FirstName
- Gender
- GeographyKey
- HouseOwnerFlag
- LastName
- MaritalStatus
- NumberCarsOwned
- NumberChildrenAtHome
- Region
- TotalChildren
- YearlyIncome
複数の列を選択するには Shift キーを使用します。
[次へ] をクリックします。
[列のコンテンツおよびデータ型の指定] ページで、[検出] をクリックします。
数値データをサンプリングし、連続値または不連続値のどちらが数値列に含まれているのかを判断するアルゴリズムが実行されます。たとえば、給与情報を表す列の場合、実際の給与額 (連続値) が入力される場合と、1 = $25,000 未満、2 = $25,000 ~ 50,000 などのように、給与額の範囲を示す整数 (不連続値) が入力される場合があります。
[検出] をクリックしてから、[コンテンツの種類] 列および [データ型] 列のエントリに、次の表に示す設定が記載されていることを確認します。
列 [コンテンツの種類] [データ型] Age
Continuous
Long
BikeBuyer
Discrete
Long
CommuteDistance
Discrete
Text
CustomerKey
Key
Long
EnglishEducation
Discrete
Text
EnglishOccupation
Discrete
Text
FirstName
Discrete
Text
Gender
Discrete
Text
GeographyKey
Discrete
Text
HouseOwnerFlag
Discrete
Text
LastName
Discrete
Text
MaritalStatus
Discrete
Text
NumberCarsOwned
Discrete
Long
NumberChildrenAtHome
Discrete
Long
Region
Discrete
Text
TotalChildren
Discrete
Long
YearlyIncome
Continuous
Double
メモ : |
|---|
| このデータ マイニング アルゴリズムでは、数値のみに基づいて GeographyKey 列に連続値が含まれることを示唆します。ただし、郵便番号などの数値については、数値を使った数学的処理に意味がないため、一般的には連続値ではなく不連続値として扱います。 |
- [次へ] をクリックします。
- [ウィザードの完了] ページの [マイニング構造名] に「Targeted Mailing」と入力します。
- [マイニング モデル名] に「TM_Decision_Tree」と入力します。
- [ドリルスルーを許可する] チェック ボックスをオンにします。
- [完了] をクリックします。
メモ :