共用方式為


自訂資料採礦模型 (Analysis Services - 資料採礦)

當您選取符合商務需求的演算法之後,可以使用下列方式來自訂採礦模型,以便能夠得到更好的結果。

  • 請使用模型中的不同資料行,或是變更資料行的使用方式或內容類型。

  • 在採礦模型中建立篩選,以限制用於定型此模型的資料。

  • 設定演算法參數來控制臨界值、樹狀結構分岔之處或是其他條件。

  • 變更用來分析資料或做預測的預設演算法。

變更模型所用的資料

您所做的有關要將哪一個資料行用於模型以及如何使用和處理該資料的決策,將會大大地影響分析的結果。下列主題提供的資訊可幫助您了解這些選擇。

如果您使用資料採礦精靈,您也可以讓 Analysis Services 自動選取對於建立特定模型最有用的資料。

自訂演算法設定

演算法的選擇會決定您將取得那些類型的結果。如需有關特定演算法之運作方式的一般資訊,或是使用特定演算法可獲益的商務案例,請參閱<資料採礦演算法 (Analysis Services - 資料採礦)>。

Analysis Services 中所提供的資料採礦演算法也可大幅地加以自訂。您可以設定演算法參數來控制演算法的行為以及它處理資料的方式。下列主題提供有關每一個演算法支援之參數的詳細資訊。

Microsoft 決策樹演算法技術參考

Microsoft 群集演算法技術參考

Microsoft 貝氏機率分類演算法技術參考

Microsoft 關聯分析演算法技術參考

Microsoft 時序群集演算法技術參考

Microsoft 類神經網路演算法技術參考

Microsoft 羅吉斯迴歸演算法技術參考

Microsoft 線性迴歸演算法技術參考

Microsoft 時間序列演算法技術參考

每一個演算法類型的主題也會列出可以搭配以該演算法為根據之模型一起使用的預測函數。

演算法參數的清單

每一個演算法都支援可用來自訂演算法行為及微調模型結果的參數。如需如何使用每一個參數的描述,請參閱下列主題:

屬性名稱

適用於

AUTO_DETECT_PERIODICITY

Microsoft 時間序列演算法技術參考

CLUSTER_COUNT

Microsoft 群集演算法技術參考

Microsoft 時序群集演算法技術參考

CLUSTER_SEED

Microsoft 群集演算法技術參考

CLUSTERING_METHOD

Microsoft 群集演算法技術參考

COMPLEXITY_PENALTY

Microsoft 決策樹演算法技術參考

Microsoft 時間序列演算法技術參考

FORCED_REGRESSOR

Microsoft 決策樹演算法技術參考

Microsoft 線性迴歸演算法技術參考

FORECAST_METHOD

Microsoft 時間序列演算法技術參考

HIDDEN_NODE_RATIO

Microsoft 類神經網路演算法技術參考

HISTORIC_MODEL_COUNT

Microsoft 時間序列演算法技術參考

HISTORICAL_MODEL_GAP

Microsoft 時間序列演算法技術參考

HOLDOUT_PERCENTAGE

Microsoft 羅吉斯迴歸演算法技術參考

Microsoft 類神經網路演算法技術參考

附註附註
這個參數與適用於採礦結構的鑑效組百分比值不同。

HOLDOUT_SEED

Microsoft 羅吉斯迴歸演算法技術參考

Microsoft 類神經網路演算法技術參考

附註附註
這個參數與適用於採礦結構的鑑效組初始值不同。

INSTABILITY_SENSITIVITY

Microsoft 時間序列演算法技術參考

MAXIMUM_INPUT_ATTRIBUTES

Microsoft 群集演算法技術參考

Microsoft 決策樹演算法技術參考

Microsoft 線性迴歸演算法技術參考

Microsoft 貝氏機率分類演算法技術參考

Microsoft 類神經網路演算法技術參考

Microsoft 羅吉斯迴歸演算法技術參考

MAXIMUM_ITEMSET_COUNT

Microsoft 關聯分析演算法技術參考

MAXIMUM_ITEMSET_SIZE

Microsoft 關聯分析演算法技術參考

MAXIMUM_OUTPUT_ATTRIBUTES

Microsoft 決策樹演算法技術參考

Microsoft 線性迴歸演算法技術參考

Microsoft 羅吉斯迴歸演算法技術參考

Microsoft 貝氏機率分類演算法技術參考

Microsoft 類神經網路演算法技術參考

MAXIMUM_SEQUENCE_STATES

Microsoft 時序群集演算法技術參考

MAXIMUM_SERIES_VALUE

Microsoft 時間序列演算法技術參考

MAXIMUM_STATES

Microsoft 群集演算法技術參考

Microsoft 類神經網路演算法技術參考

Microsoft 時序群集演算法技術參考

MAXIMUM_SUPPORT

Microsoft 關聯分析演算法技術參考

MINIMUM_IMPORTANCE

Microsoft 關聯分析演算法技術參考

MINIMUM_ITEMSET_SIZE

Microsoft 關聯分析演算法技術參考

MINIMUM_DEPENDENCY_PROBABILITY

Microsoft 貝氏機率分類演算法技術參考

MINIMUM_PROBABILITY

Microsoft 關聯分析演算法技術參考

MINIMUM_SERIES_VALUE

Microsoft 時間序列演算法技術參考

MINIMUM_SUPPORT

Microsoft 關聯分析演算法技術參考

Microsoft 群集演算法技術參考

Microsoft 決策樹演算法技術參考

Microsoft 時序群集演算法技術參考

Microsoft 時間序列演算法技術參考

MISSING_VALUE_SUBSTITUTION

Microsoft 時間序列演算法技術參考

MODELLING_CARDINALITY

Microsoft 群集演算法技術參考

PERIODICITY_HINT

Microsoft 時間序列演算法技術參考

PREDICTION_SMOOTHING

Microsoft 時間序列演算法技術參考

SAMPLE_SIZE

Microsoft 群集演算法技術參考

Microsoft 羅吉斯迴歸演算法技術參考

Microsoft 類神經網路演算法技術參考

SCORE_METHOD

Microsoft 決策樹演算法技術參考

SPLIT_METHOD

Microsoft 決策樹演算法技術參考

STOPPING_TOLERANCE

Microsoft 群集演算法技術參考

其他需求

選擇資料及準備資料是資料採礦程序的一個重要部分。例如,Microsoft 提供的演算法不允許重複的索引鍵。每一個模型所需的資料類型會因演算法而異。如需詳細資訊,請參閱下列主題的「需求」一節:

您可以使用查詢和預測函數來自訂結果

在建立及處理模型後,您可以使用每個模型類型特有的其中一個檢視器來檢視資訊。另外,您也可以使用資料採礦延伸模組 (DMX) 來撰寫自訂查詢,以取得有關資料中找到之模式的更進階或更詳細的資訊。

如需有關如何建立可傳回模型內容之查詢的詳細資訊,請參閱<查詢資料採礦模型 (Analysis Services - 資料採礦)>。

您可以使用函數來擴充採礦模型傳回的結果。某些函數也會傳回代表結果或其他分數之機率的統計資料。此外,個別演算法也會支援其他函數。例如,如果採礦模型使用群集,您可以使用特殊函數來尋找有關群集的資訊。但是,如果您的模型是根據時間序列演算法,可以使用一組不同的函數做預測及查詢模型內容。如需詳細資訊,請參閱每一個演算法的「技術參考」主題。

如需如何查詢採礦模型及如何使用為特定模型類型設計之預測函數的範例,請參閱<查詢資料採礦模型 (Analysis Services - 資料採礦)>。

如需所有演算法類型都支援的預測函數清單,請參閱<將函數對應至查詢類型 (DMX)>。

評估模型的變更

當您嘗試用不同模型解決商務問題,或是建立同一個模型的不同版本時,您必須量測各模型的精確度,同時評估各模型解決商務問題的成功程度。如需有關評估資料採礦模型的一般資訊,請參閱<驗證資料採礦模型 (Analysis Services - 資料採礦)>。如需有關如何以圖表表示不同採礦模型之精確度的詳細資訊,請參閱<圖表模型精確度的工具 (Analysis Services - 資料採礦)>。