レッスン 1: Bike Buyer マイニング構造の作成
更新 : 2007 年 9 月 15 日
このレッスンでは、Adventure Works Cycles の潜在顧客が自転車を購入するかどうかを予測するためのマイニング構造を作成します。マイニング構造と、データ マイニングにおけるマイニング構造の役割については、「マイニング構造 (Analysis Services)」を参照してください。
このレッスンで作成する Bike Buyer マイニング構造には、Microsoft デシジョン ツリー アルゴリズムと Microsoft クラスタリング アルゴリズムに基づくマイニング モデルを追加できます。後のレッスンでは、クラスタ マイニング モデルを使用して顧客をグループ化するさまざまな方法を確認し、デシジョン ツリー マイニング モデルを使用して潜在顧客が自転車を購入するかどうかを予測します。
CREATE MINING STRUCTURE ステートメント
マイニング構造を作成するには、CREATE MINING STRUCTURE (DMX) ステートメントを使用します。ステートメントのコードは次の部分に分けられます。
- 構造の名前指定
- キー列の定義
- マイニング列の定義
CREATE MINING STRUCTURE ステートメントの汎用例を次に示します。
CREATE MINING STRUCTURE [<mining structure name>]
(
<key column>,
<mining structure columns>
)
コードの 1 行目では、構造の名前を定義します。
CREATE MINING STRUCTURE [<mining structure name>]
DMX でオブジェクトに名前を付ける方法については、「識別子 (DMX)」を参照してください。
コードの次の行では、マイニング構造のキー列を定義します。キー列は、ソース データ内のエンティティを一意に識別します。
<key column>,
このマイニング構造では、顧客の識別子 (CustomerKey) でソース データ内のエンティティが定義されています。
コードの最終行では、マイニング構造に関連付けられたマイニング モデルで使用される、マイニング列を定義します。
<mining structure columns>
<mining structure columns> 内で、DISCRETIZE 関数を次の構文で使用すると、連続列の値を不連続値に変換することができます。
DISCRETIZE(<method>,<number of buckets>)
列の分離の詳細については、「分離メソッド」を参照してください。定義できるマイニング構造列の種類の詳細については、「マイニング構造列」を参照してください。
このレッスンの作業
このレッスンでは、次の作業を行います。
- 新しい空のクエリの作成
- マイニング構造を作成するためのクエリの変更
- クエリの実行
クエリの作成
最初の手順では、SQL Server Management Studio で、Analysis Services のインスタンスに接続して新しい DMX クエリを作成します。
SQL Server Management Studio で新しい DMX クエリを作成するには
SQL Server Management Studio を開きます。
[サーバーへの接続] ダイアログ ボックスで、[サーバーの種類] の [Analysis Services] を選択します。[サーバー名] に、「LocalHost」と入力するか、このレッスンで接続する Analysis Services のインスタンスの名前を入力して、[接続] をクリックします。
オブジェクト エクスプローラで、Analysis Services インスタンスを右クリックし、[新しいクエリ] をポイントして [DMX] をクリックします。
クエリ エディタが開き、新しい空のクエリが表示されます。
クエリの変更
次の手順では、上の CREATE MINING STRUCTURE ステートメントを変更し、Bike Buyer マイニング構造を作成します。
CREATE MINING STRUCTURE ステートメントをカスタマイズするには
クエリ エディタで、CREATE MINING STRUCTURE ステートメントの汎用例を空のクエリにコピーします。
次の部分を探します。
[<mining structure>]
これを次の文字列に置き換えます。
[Bike Buyer]
次の部分を探します。
<key column>
これを次の文字列に置き換えます。
CustomerKey LONG KEY
次の部分を探します。
<mining structure columns>
これを次の文字列に置き換えます。
[Age] LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS
最終的なマイニング構造のステートメントは次のようになります。
CREATE MINING STRUCTURE [Bike Buyer] ( [Customer Key] LONG KEY, [Age]LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS )
[ファイル] メニューで、[名前を付けて DMXQuery1.dmx を保存] をクリックします。
[名前を付けて保存] ダイアログ ボックスで、適切なフォルダを指定し、ファイルに「Bike Buyer Structure.dmx」という名前を付けます。
クエリの実行
最後の手順では、クエリを実行します。クエリを作成して保存したら、クエリ内のステートメントを実行して、サーバー上にマイニング構造を作成する必要があります。クエリ エディタでのクエリの実行の詳細については、「SQL Server Management Studio の Transact SQL クエリ」を参照してください。
クエリを実行するには
クエリ エディタのツール バーで、[実行] をクリックします。
ステートメントの実行完了後、クエリ エディタ下部の [メッセージ] タブにクエリの状態が表示されます。この場合次のメッセージが表示されます。
Executing the query Execution complete
これで、Bike Buyer という名前の新しい構造が、サーバー上に作成されました。
次のレッスンでは、作成した構造にマイニング モデルを追加します。