自訂資料採礦模型 (Analysis Services - 資料採礦)
當您選取符合商務需求的演算法之後,可以使用下列方式來自訂採礦模型,以便能夠得到更好的結果。
請使用模型中的不同資料行,或是變更資料行的使用方式或內容類型。
在採礦模型中建立篩選,以限制用於定型此模型的資料。
設定演算法參數來控制臨界值、樹狀結構分岔之處或是其他條件。
變更用來分析資料或做預測的預設演算法。
變更模型所用的資料
您所做的有關要將哪一個資料行用於模型以及如何使用和處理該資料的決策,將會大大地影響分析的結果。下列主題提供的資訊可幫助您了解這些選擇。
採礦模型 (Analysis Services - 資料採礦)
提供採礦模型架構的概觀,包括基礎採礦結構及採礦資料行的選擇。
建立採礦模型的篩選 (Analysis Services - 資料採礦)
說明您要如何建立套用到採礦模型的篩選,以便根據採礦結構資料的子集建立模型。
-
說明 Analysis Services 會如何使用稱為「特徵選取」(Feature Selection) 的程序,只選取最有用的屬性來加入模型。減少資料行和屬性的數目可以改善效能和模型的品質。可用的特徵選取方法取決於您選擇的演算法而定。
如果您使用資料採礦精靈,您也可以讓 Analysis Services 自動選取對於建立特定模型最有用的資料。
自訂演算法設定
演算法的選擇會決定您將取得那些類型的結果。如需有關特定演算法之運作方式的一般資訊,或是使用特定演算法可獲益的商務案例,請參閱<資料採礦演算法 (Analysis Services - 資料採礦)>。
Analysis Services 中所提供的資料採礦演算法也可大幅地加以自訂。您可以設定演算法參數來控制演算法的行為以及它處理資料的方式。下列主題提供有關每一個演算法支援之參數的詳細資訊。
每一個演算法類型的主題也會列出可以搭配以該演算法為根據之模型一起使用的預測函數。
演算法參數的清單
每一個演算法都支援可用來自訂演算法行為及微調模型結果的參數。如需如何使用每一個參數的描述,請參閱下列主題:
屬性名稱 |
適用於 |
---|---|
AUTO_DETECT_PERIODICITY |
|
CLUSTER_COUNT |
|
CLUSTER_SEED |
|
CLUSTERING_METHOD |
|
COMPLEXITY_PENALTY |
|
FORCED_REGRESSOR |
|
FORECAST_METHOD |
|
HIDDEN_NODE_RATIO |
|
HISTORIC_MODEL_COUNT |
|
HISTORICAL_MODEL_GAP |
|
HOLDOUT_PERCENTAGE |
附註
這個參數與適用於採礦結構的鑑效組百分比值不同。
|
HOLDOUT_SEED |
附註
這個參數與適用於採礦結構的鑑效組初始值不同。
|
INSTABILITY_SENSITIVITY |
|
MAXIMUM_INPUT_ATTRIBUTES |
|
MAXIMUM_ITEMSET_COUNT |
|
MAXIMUM_ITEMSET_SIZE |
|
MAXIMUM_OUTPUT_ATTRIBUTES |
|
MAXIMUM_SEQUENCE_STATES |
|
MAXIMUM_SERIES_VALUE |
|
MAXIMUM_STATES |
|
MAXIMUM_SUPPORT |
|
MINIMUM_IMPORTANCE |
|
MINIMUM_ITEMSET_SIZE |
|
MINIMUM_DEPENDENCY_PROBABILITY |
|
MINIMUM_PROBABILITY |
|
MINIMUM_SERIES_VALUE |
|
MINIMUM_SUPPORT |
|
MISSING_VALUE_SUBSTITUTION |
|
MODELLING_CARDINALITY |
|
PERIODICITY_HINT |
|
PREDICTION_SMOOTHING |
|
SAMPLE_SIZE |
|
SCORE_METHOD |
|
SPLIT_METHOD |
|
STOPPING_TOLERANCE |
其他需求
選擇資料及準備資料是資料採礦程序的一個重要部分。例如,Microsoft 提供的演算法不允許重複的索引鍵。每一個模型所需的資料類型會因演算法而異。如需詳細資訊,請參閱下列主題的「需求」一節:
您可以使用查詢和預測函數來自訂結果
在建立及處理模型後,您可以使用每個模型類型特有的其中一個檢視器來檢視資訊。另外,您也可以使用資料採礦延伸模組 (DMX) 來撰寫自訂查詢,以取得有關資料中找到之模式的更進階或更詳細的資訊。
如需有關如何建立可傳回模型內容之查詢的詳細資訊,請參閱<查詢資料採礦模型 (Analysis Services - 資料採礦)>。
您可以使用函數來擴充採礦模型傳回的結果。某些函數也會傳回代表結果或其他分數之機率的統計資料。此外,個別演算法也會支援其他函數。例如,如果採礦模型使用群集,您可以使用特殊函數來尋找有關群集的資訊。但是,如果您的模型是根據時間序列演算法,可以使用一組不同的函數做預測及查詢模型內容。如需詳細資訊,請參閱每一個演算法的「技術參考」主題。
如需如何查詢採礦模型及如何使用為特定模型類型設計之預測函數的範例,請參閱<查詢資料採礦模型 (Analysis Services - 資料採礦)>。
如需所有演算法類型都支援的預測函數清單,請參閱<將函數對應至查詢類型 (DMX)>。
評估模型的變更
當您嘗試用不同模型解決商務問題,或是建立同一個模型的不同版本時,您必須量測各模型的精確度,同時評估各模型解決商務問題的成功程度。如需有關評估資料採礦模型的一般資訊,請參閱<驗證資料採礦模型 (Analysis Services - 資料採礦)>。如需有關如何以圖表表示不同採礦模型之精確度的詳細資訊,請參閱<圖表模型精確度的工具 (Analysis Services - 資料採礦)>。