第 1 課:建立自行車買主採礦結構
在這一課,您將建立一個可讓您預測 Adventure Works Cycles 的潛在客戶是否將購買自行車的採礦結構。如果您不熟悉採礦結構及其在資料採礦中的角色,請參閱<採礦結構 (Analysis Services - 資料採礦)>。
您將在這一課建立的自行車買主採礦結構支援加入以<Microsoft 群集演算法>和<Microsoft 決策樹演算法>為基礎的採礦模型。在後面的課程中,您將使用群集採礦模型來探索可分組客戶的不同方式,並將使用決策樹採礦模型來預測潛在客戶是否會購買自行車。
CREATE MINING STRUCTURE 陳述式
若要建立採礦結構,請使用 CREATE MINING STRUCTURE (DMX) 陳述式。陳述式中的程式碼可分成下列各部份:
命名結構。
定義索引鍵資料行。
定義採礦資料行。
定義選擇性的測試資料集。
以下是 CREATE MINING STRUCTURE 陳述式的一般範例:
CREATE MINING STRUCTURE [<mining structure name>]
(
<key column>,
<mining structure columns>
)
WITH HOLDOUT (<holdout specifier>)
程式碼的第一行定義結構的名稱:
CREATE MINING STRUCTURE [<mining structure name>]
如需有關在資料採礦延伸模組 (DMX) 中命名物件的詳細資訊,請參閱<識別碼 (DMX)>。
程式碼的下一行定義採礦結構的索引鍵資料行,可唯一識別來源資料中的實體:
<key column>,
在您要建立的採礦結構中,客戶識別碼 CustomerKey 定義來源資料中的實體。
程式碼的下一行用來定義採礦資料行,與採礦結構相關聯的採礦模型將使用這些資料行:
<mining structure columns>
您可以在 <採礦結構資料行> 內使用 DISCRETIZE 函數,利用下列語法來分隔連續資料行:
DISCRETIZE(<method>,<number of buckets>)
如需有關分隔資料行的詳細資訊,請參閱<分隔方法 (資料採礦)>。如需有關您可以定義之採礦結構資料行類型的詳細資訊,請參閱<採礦結構資料行>。
程式碼的最後一行定義採礦結構中的選擇性資料分割:
WITH HOLDOUT (<holdout specifier>)
您將資料的某些部分指定為用來測試與結構相關的採購模型,而將剩餘的資料指定為用來定型模型。根據預設,Analysis Services 所建立的測試資料集會包含所有案例資料的 30%。您要加入規格,規定測試資料集應該包含 30% 的案例,最多可達 1000 個案例。如果 30% 的案例數少於 1000,則測試資料集將包含較小的數量。
課程工作
您將在這一課執行下列工作:
建立新的空白查詢。
改變查詢來建立採礦結構。
執行查詢。
建立查詢
第一步是連接到 Analysis Services 的執行個體,並在 SQL Server Management Studio 中建立新的 DMX 查詢。
若要在 SQL Server Management Studio 中建立新的 DMX 查詢
開啟 SQL Server Management Studio。
在 [連接到伺服器] 對話方塊中,選取 [Analysis Services] 做為 [伺服器類型]。在 [伺服器名稱] 中,輸入 LocalHost,或您要在這一課連接的 Analysis Services 執行個體名稱。按一下 [連接]。
在 [物件總管] 中,以滑鼠右鍵按一下 Analysis Services 的執行個體,指向 [新增查詢],再按一下 [DMX] 開啟 [查詢編輯器] 以及新的空白查詢。
改變查詢
下一步是修改上述 CREATE MINING STRUCTURE 陳述式來建立自行車買主採礦結構。
若要自訂 CREATE MINING STRUCTURE 陳述式
在查詢編輯器中,將 CREATE MINING STRUCTURE 陳述式的一般範例複製到空白查詢中。
取代下列項目:
[<mining structure>]
成為:
[Bike Buyer]
取代下列項目:
<key column>
成為:
CustomerKey LONG KEY
取代下列項目:
<mining structure columns>
成為:
[Age] LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned] LONG DISCRETE, [Number Children At Home] LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS
取代下列項目:
WITH HOLDOUT (holdout specifier>)
成為:
WITH HOLDOUT (30 PERCENT or 1000 CASES)
現在,完整的採礦結構陳述式應該如下所示:
CREATE MINING STRUCTURE [Bike Buyer] ( [Customer Key] LONG KEY, [Age]LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS ) WITH HOLDOUT (30 PERCENT or 1000 CASES)
按一下 [檔案] 功能表上的 [將 DMXQuery1.dmx 另存為]。
在 [另存新檔] 對話方塊中,瀏覽至適當的資料夾,並將檔案命名為 Bike Buyer Structure.dmx。
執行查詢
最後的步驟是執行查詢。在建立及儲存查詢以後,將需要執行查詢。也就是說,必須執行此陳述式,才能夠在伺服器上建立採礦結構。如需有關在查詢編輯器中執行查詢的詳細資訊,請參閱<SQL Server Management Studio Database Engine 查詢編輯器視窗>。
若要執行查詢
在查詢編輯器的工具列上,按一下 [執行]。
當陳述式執行完畢之後,查詢的狀態會顯示在查詢編輯器底端的 [訊息] 索引標籤上。訊息應該顯示如下:
Executing the query Execution complete
現在,伺服器上出現一個稱為 [自行車買主] 的新結構。
在下一課,您會將採礦模型加入剛才建立的結構中。