在本課中,您將把兩個採礦模型新增到您在第 1 課:建立市場籃子採礦結構時創建的結構內。 這些採礦模型可讓您建立預測。
若要預測客戶傾向於同時購買的產品類型,您將使用 Microsoft關聯演算法 建立兩個採礦模型,併為 MINIMUM_PROBABILTY 參數建立兩個不同的值。
MINIMUM_PROBABILTY 是Microsoft關聯演算法參數,可藉由指定規則必須擁有的最小機率,協助判斷採礦模型將包含的規則數目。 例如,將此值設定為 0.4 指定只有在規則描述的產品群組至少有 40% 的發生機率時,才能產生規則。
您將會在稍後的課程中檢視變更 MINIMUM_PROBABILTY 參數的效果。
ALTER MINING STRUCTURE 語句
若要將包含巢狀數據表的採礦模型新增至採礦結構,請使用 ALTER MINING STRUCTURE (DMX) 語句。 語句中的程式代碼可以分成下列部分:
識別採礦結構
命名採礦模型
定義關鍵欄位
定義輸入和可預測欄位
定義巢狀表格欄位
識別演算法和參數變更
以下是 ALTER MINING STRUCTURE 語句的泛型範例,可將採礦模型加入至包含巢狀資料表資料列的結構:
ALTER MINING STRUCTURE [<Mining Structure Name>]
ADD MINING MODEL [<Mining Model Name>]
(
[<key column>],
<mining model column> <usage>,
<table columns>
( [<nested key column>],
<nested mining model columns> )
) USING <algorithm>( <algorithm parameters> )
程序代碼的第一行會識別將新增採礦模型的現有採礦結構:
ALTER MINING STRUCTURE [<mining structure name>]
程序代碼的下一行會命名將新增至採礦結構的採礦模型:
ADD MINING MODEL [<mining model name>]
如需在數據採礦延伸模組中命名對象的相關信息,請參閱標識碼(DMX)。
程序代碼的下一行會定義採礦結構中的數據行,而採礦模型將使用這些數據行:
[<key column>],
<mining model columns> <usage>,
您只能使用已存在於採礦結構中的數據行。
採礦模型列清單中的第一個列必須是採礦結構中的關鍵列。 不過,您不需要在索引鍵數據行後面輸入 KEY ,即可指定使用方式。 這是因為您已在建立採礦結構時將欄位定義為主鍵。
其餘行會指定新採礦模型中欄位的使用方式。 您可以使用下列語法,指定採礦模型中的數據行將用於預測:
<column name> PREDICT,
如果您未指定用途,則不需要在清單中包含資料探勘結構欄位。 參考數據採礦結構所使用的所有數據行都會自動可供以該結構為基礎的採礦模型使用。 不過,除非您指定使用方式,否則模型不會使用欄位進行訓練。
程式代碼中的最後一行會定義將用來產生採礦模型的演算法和演演算法參數。
) USING <algorithm>( <algorithm parameters> )
課程任務
您將在此課程中執行下列工作:
使用默認機率將關聯採礦模型新增至 結構
使用修改的機率,將關聯採礦模型新增至結構
使用預設的最低概率將關聯分析模型加入至結構中
第一項工作是使用 MINIMUM_PROBABILITY的預設值,根據Microsoft關聯演算法,將新的採礦模型新增至購物籃採礦結構。
若要新增關聯採礦模型
在 物件總管 中,以滑鼠右鍵點擊 Analysis Services 實例,指向 新增查詢,然後按一下 DMX。
查詢編輯器隨即開啟,並包含新的空白查詢。
備註
若要針對特定 Analysis Services 資料庫建立 DMX 查詢,請以滑鼠右鍵按兩下資料庫,而不是實例。
將語句的
ALTER MINING STRUCTURE泛型範例複製到空白查詢中。取代下列項目:
<mining structure name>取代為:
[Market Basket]取代下列項目:
<mining model name>取代為:
[Default Association]取代下列項目:
[<key column>], <mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )取代為:
OrderNumber, [Products] PREDICT ( [Model] )在此情況下,
[Products]表格已指定為可預測的欄位.。此外,[Model]欄位會包含在巢狀表格的欄位清單中,因為它是巢狀表格的索引鍵欄。備註
請記住,巢狀金鑰與案例索引鍵不同。 案例索引鍵是案例的唯一標識符,而巢狀索引鍵是您想要建立模型的屬性。
取代下列項目:
USING <algorithm>( <algorithm parameters> )取代為:
Using Microsoft_Association_Rules產生的語句現在應該如下所示:
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Default Association] ( OrderNumber, [Products] PREDICT ( [Model] ) ) Using Microsoft_Association_Rules在 [檔案] 功能表上,按一下 [另存新檔 DMXQuery1.dmx]。
在 [ 另存新檔 ] 對話框中,瀏覽至適當的資料夾,並將檔案
Default_Association_Model.dmx命名為 。在工具列上,按兩下 [ 執行] 按鈕。
將關聯採礦模型新增到結構中,並變更預設的MINIMUM_PROBABILITY
下一項工作是根據Microsoft關聯演算法,將新的採礦模型新增至 Market Basket 採礦結構,並將MINIMUM_PROBABILITY的預設值變更為 0.01。 變更 參數會導致Microsoft關聯演算法建立更多規則。
若要新增關聯採礦模型
在 [物件總管]中,以滑鼠右鍵按一下 Analysis Services 實例,指向[新增查詢],然後按一下 [DMX]。
查詢編輯器隨即開啟,並包含新的空白查詢。
將語句的
ALTER MINING STRUCTURE泛型範例複製到空白查詢中。取代下列項目:
<mining structure name>取代為:
Market Basket取代下列項目:
<mining model name>取代為:
[Modified Association]取代下列項目:
<mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )取代為:
OrderNumber, [Products] PREDICT ( [Model] )在此情況下,
[Products]數據表已指定為可預測的數據行。 此外,[MODEL]數據行會包含在清單中,因為它是巢狀數據表中的索引鍵數據行。取代下列項目:
USING <algorithm>( <algorithm parameters> )取代為:
USING Microsoft_Association_Rules (Minimum_Probability = 0.1)產生的語句現在應該如下所示:
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Modified Assocation] ( OrderNumber, [Products] PREDICT ( [Model] ) ) USING Microsoft_Association_Rules (Minimum_Probability = 0.1)在 [ 檔案] 功能表上,按兩下 [ 儲存 DMXQuery1.dmx As]。
在 [ 另存新檔 ] 對話框中,瀏覽至適當的資料夾,並將檔案
Modified Association_Model.dmx命名為 。在工具列上,按兩下 [ 執行] 按鈕。
在下一課,您將處理 Market Basket 採礦結構及其相關聯的採礦模型。