共用方式為


自訂採礦模型和結構

選取符合業務需求的演算法之後,您可以透過下列方式自定義採礦模型,以可能改善結果。

  • 在模型中使用不同的數據行,或變更數據行的使用方式、內容類型或離散化方法。

  • 在採礦模型上建立篩選條件,以限制用於定型模型的數據。

  • 變更用來分析數據的演算法。

  • 設定演算法參數來控制臨界值、樹狀結構分割和其他重要條件。

本主題描述這些選項。

變更模型所使用的數據

您決定在模型中使用哪些數據行,以及如何使用和處理該數據,極大地影響分析的結果。 下列主題提供的資訊可協助您了解這些選擇。

使用特徵選取

Analysis Services 中的大部分數據採礦演算法會使用稱為 特徵選取 的程式,只選取最有用的屬性以新增至模型。 減少數據行和屬性的數目可以改善模型的效能和品質。 可用的特徵選取方法會根據您選擇的演算法而有所不同。

特徵選擇 (資料採礦)

改變使用方式

您可以變更採礦模型中所包含的數據行,以及每個數據行的使用方式。 如果您未取得預期的結果,您應該檢視您所使用的輸入數據行,並反思這些數據行是否為好的選擇,以及是否有改善數據處理方式的任何方法,包括:

  • 識別錯誤標示為數字的類別變數。

  • 新增類別以折疊屬性數目,並讓您更容易找到相互關聯。

  • 變更數位量化或離散化的方式。

  • 去除擁有許多唯一值的欄位,或是實際用來做參考而不適合分析的欄位,例如地址或中間名。

您不需要從採礦結構實際移除數據行;您可以只將數據行標示為 Ignore。 該欄位雖然從採礦模型中移除,但仍可供結構中的其他採礦模型使用,或在鑽取查詢中被引用。

建立模型欄位的別名

當 Analysis Services 建立採礦模型時,它會使用採礦結構中的相同數據行名稱。 您可以將別名新增至採礦模型中的任何數據行。 這可能會讓您更容易了解數據行內容或使用方式,或縮短名稱以方便建立查詢。 當您想要建立數據行復本並將其命名為描述性內容時,別名也很有用。

您可以編輯 Name 採礦模型數據行的 屬性來建立別名。 Analysis Services 會繼續使用原始名稱做為數據行的標識碼,而您輸入 Name 的新值會變成數據行別名,並出現在數據行使用方式旁的方格中。

採礦模型列上的別名

此圖顯示具有多個與收入相關的採礦結構欄位副本的相關模型。 結構數據行的每個復本都以不同的方式離散化。 圖表中的模型會分別使用與採礦結構不同的數據行;不過,為了方便比較模型的數據行,每個模型中的數據行已重新命名為 [Income]。

新增篩選

您可以將篩選新增至採礦模型。 篩選條件是一組 WHERE 條件,可將模型案例中的數據限製為某些子集。 篩選會在定型模型時使用,而且可以選擇性地用於測試模型或建立精確度圖表時。

藉由新增篩選,您可以重複使用資料採礦結構,並根據不同的數據子集建立模型。 或者,您可以直接使用篩選來排除特定數據列並改善分析品質。

如需詳細資訊,請參閱採礦模型的篩選(Analysis Services - 數據採礦)。

變更演算法

雖然新增至採礦結構的新模型會共用相同的數據集,但您可以使用不同的演算法來取得不同的結果(如果數據支援),或變更演算法的參數。 您也可以設定模型旗標。

選擇演算法會決定您將得到何種結果。 如需特定演算法運作方式的一般資訊,或您將受益於使用特定演算法的商務案例,請參閱數據採礦演算法(Analysis Services - 數據採礦)。

如需需求和限制的描述,請參閱每個演算法的技術參考主題,以及每個演算法所支援之自定義的詳細資訊。

Microsoft判定樹演算法 Microsoft時間序列演算法
Microsoft叢集演算法 Microsoft類神經網路演算法
Microsoft朴素貝氏演算法 Microsoft羅吉斯回歸演算法
Microsoft關聯演算法 Microsoft線性回歸演算法
Microsoft時序群集演算法

自定義演算法參數

每個演算法都支援用來自定義算法行為的參數,並可精細調整模型的結果。 如需如何使用每個參數的描述,請參閱下列主題:

每個演算法類型的主題也會列出可根據該演算法與模型搭配使用的預測函式。

屬性名稱 適用對象
自動檢測週期性 Microsoft 時間序列演算法技術參考
群集計數 Microsoft叢集演算法技術參考

Microsoft時序群集演算法技術參考
CLUSTER_SEED(叢集種子) Microsoft叢集演算法技術參考
CLUSTERING_METHOD Microsoft叢集演算法技術參考
複雜性懲罰 Microsoft判定樹演算法技術參考

Microsoft時間序列演算法技術參考
FORCE_REGRESSOR Microsoft判定樹演算法技術參考

Microsoft線性回歸演算法技術參考

模型旗標 (資料採礦)
預測方法 Microsoft 時間序列演算法技術參考
HIDDEN_NODE_RATIO Microsoft類神經網路演算法技術參考
歷史模型數量 Microsoft 時間序列演算法技術參考
歷史模型差距 Microsoft 時間序列演算法技術參考
保留比例 Microsoft羅吉斯回歸演算法技術參考

Microsoft類神經網路演算法技術參考

注意:此參數與應用於採礦結構的保留百分比值不同。
保留種子 Microsoft羅吉斯回歸演算法技術參考

Microsoft類神經網路演算法技術參考

注意:此參數與應用於採礦結構的留存種子值不同。
不穩定性敏感度 Microsoft時間序列演算法技術參考
最大輸入屬性 Microsoft叢集演算法技術參考

Microsoft判定樹演算法技術參考

Microsoft線性回歸演算法技術參考

Microsoft 樸素貝葉斯演算法技術參考

Microsoft類神經網路演算法技術參考

Microsoft羅吉斯回歸演算法技術參考
最大項目集數量 Microsoft關聯演算法技術參考
MAXIMUM_ITEMSET_SIZE Microsoft關聯演算法技術參考
最大輸出屬性 Microsoft判定樹演算法技術參考

Microsoft線性回歸演算法技術參考

Microsoft羅吉斯回歸演算法技術參考

Microsoft 樸素貝葉斯演算法技術參考

Microsoft類神經網路演算法技術參考
最大序列狀態 Microsoft時序群集演算法技術參考
最大序列值 Microsoft時間序列演算法技術參考
最大狀態 Microsoft叢集演算法技術參考

Microsoft類神經網路演算法技術參考

Microsoft時序群集演算法技術參考
最大支援 Microsoft關聯演算法技術參考
最低重要性 Microsoft關聯演算法技術參考
最小項目集大小 Microsoft關聯演算法技術參考
MINIMUM_DEPENDENCY_PROBABILITY Microsoft 樸素貝葉斯演算法技術參考
最低概率 Microsoft關聯演算法技術參考
最小序列值 Microsoft時間序列演算法技術參考
最低支援 Microsoft關聯演算法技術參考

Microsoft叢集演算法技術參考

Microsoft判定樹演算法技術參考

Microsoft時序群集演算法技術參考

Microsoft時間序列演算法技術參考
缺失值替代 Microsoft時間序列演算法技術參考
建模基數 Microsoft叢集演算法技術參考
週期性提示 Microsoft時間序列演算法技術參考
預測平滑 (PREDICTION_SMOOTHING) Microsoft 時間序列演算法技術參考
SAMPLE_SIZE Microsoft叢集演算法技術參考

Microsoft羅吉斯回歸演算法技術參考

Microsoft類神經網路演算法技術參考
評分方法 Microsoft判定樹演算法技術參考
SPLIT_METHOD Microsoft判定樹演算法技術參考
停止公差 Microsoft叢集演算法技術參考

另請參閱

數據採礦演算法 (Analysis Services - 數據採礦)實體架構 (Analysis Services - 數據採礦)