次の方法で共有


絞り込みメール配信マイニング モデル構造の作成 (データ マイニング チュートリアル)

絞り込みメール配信シナリオを作成するには、まず、Business Intelligence Development Studio のデータ マイニング ウィザードを使用して、新しいマイニング構造とデシジョン ツリー マイニング モデルを作成します。

詳細情報

データ マイニング ウィザード, データ マイニング デザイナ, Microsoft デシジョン ツリー アルゴリズム

絞り込みメール配信シナリオ用のマイニング構造を作成するには

  1. ソリューション エクスプローラで [マイニング構造] を右クリックして、[新しいマイニング構造] をクリックします。

    データ マイニング ウィザードが開きます。

  2. [データ マイニング ウィザードへようこそ] ページで [次へ] をクリックします。

  3. [定義方法の選択] ページで [既存のリレーショナル データベースまたはデータ ウェアハウスを使用する] が選択されていることを確認し、[次へ] をクリックします。

  4. [データ マイニング技法の選択] ページで、[使用するデータ マイニング技法を指定してください] ボックスの一覧から [Microsoft デシジョン ツリー] を選択します。

    このチュートリアルでは、この初期マイニング構造に基づいて複数のモデルを作成します。最初のモデルは、ウィザードの完了時にマイニング構造と共に作成され、Microsoft デシジョン ツリー アルゴリズムに基づきます。

  5. [次へ] をクリックします。

  6. [データ ソース ビューの選択] ページでは、既定で Adventure Works DW が選択されます。[参照] をクリックしてデータ ソース ビューのテーブルを表示した後、[閉じる] をクリックしてウィザードに戻ります。

  7. [次へ] をクリックします。

  8. [テーブルの種類の指定] ページで、vTargetMail テーブルの横の [ケース] チェック ボックスをオンにして、[次へ] をクリックします。

  9. [トレーニング データの指定] ページで、CustomerKey の横にある [キー] チェック ボックスがオンになっていることを確認します。

    データ ソース ビューのソース テーブルにキーが表示されていれば、その列がモデルのキーとして自動的に選択されます。

  10. BikeBuyer 列の横にある [入力] チェック ボックスと [予測可能] チェック ボックスをオンにします。

    列が予測可能であることを指定すると、[候補検索] ボタンが有効になります。[候補検索] をクリックすると [関連列の提示] ダイアログ ボックスが開き、予測可能列に関連性の高い列が一覧表示されます。

    [関連列の提示] ダイアログ ボックスでは、予測属性との相関関係が深い順に属性が一覧表示されます。スコアが 0.05 より大きい列は、モデルに追加する対象として自動的に選択されます。提示内容を確認して [OK] をクリックします。選択した列が入力列として認識されます。このチュートリアルでは、[キャンセル] をクリックして提示を無視します。

  11. 次の列の横にある [入力] チェック ボックスをオンにします。

    • Age
    • CommuteDistance
    • EnglishEducation
    • EnglishOccupation
    • FirstName
    • Gender
    • GeographyKey
    • HouseOwnerFlag
    • LastName
    • MaritalStatus
    • NumberCarsOwned
    • NumberChildrenAtHome
    • Region
    • TotalChildren
    • YearlyIncome

    複数の列を選択するには Shift キーを使用します。

  12. [次へ] をクリックします。

  13. [列のコンテンツおよびデータ型の指定] ページで、[検出] をクリックします。

    数値データをサンプリングし、連続値または不連続値のどちらが数値列に含まれているのかを判断するアルゴリズムが実行されます。たとえば、給与情報を表す列の場合、実際の給与額 (連続値) が入力される場合と、1 = $25,000 未満、2 = $25,000 ~ 50,000 などのように、給与額の範囲を示す整数 (不連続値) が入力される場合があります。

  14. [検出] をクリックしてから、[コンテンツの種類] 列および [データ型] 列のエントリに、次の表に示す設定が記載されていることを確認します。

    [コンテンツの種類] [データ型]

    Age

    Continuous

    Long

    BikeBuyer

    Discrete

    Long

    CommuteDistance

    Discrete

    Text

    CustomerKey

    Key

    Long

    EnglishEducation

    Discrete

    Text

    EnglishOccupation

    Discrete

    Text

    FirstName

    Discrete

    Text

    Gender

    Discrete

    Text

    GeographyKey

    Discrete

    Text

    HouseOwnerFlag

    Discrete

    Text

    LastName

    Discrete

    Text

    MaritalStatus

    Discrete

    Text

    NumberCarsOwned

    Discrete

    Long

    NumberChildrenAtHome

    Discrete

    Long

    Region

    Discrete

    Text

    TotalChildren

    Discrete

    Long

    YearlyIncome

    Continuous

    Double

ms170347.note(ja-jp,SQL.90).gifメモ :
このデータ マイニング アルゴリズムでは、数値のみに基づいて GeographyKey 列に連続値が含まれることを示唆します。ただし、郵便番号などの数値については、数値を使った数学的処理に意味がないため、一般的には連続値ではなく不連続値として扱います。
  1. [次へ] をクリックします。
  2. [ウィザードの完了] ページの [マイニング構造名] に「Targeted Mailing」と入力します。
  3. [マイニング モデル名] に「TM_Decision_Tree」と入力します。
  4. [ドリルスルーを許可する] チェック ボックスをオンにします。
  5. [完了] をクリックします。

このレッスンの次の作業

メーリング対象モデルの修正 (データ マイニング チュートリアル)