採礦模型 (Analysis Services - 資料採礦)
本節說明資料採礦模型的基本架構、提供資料採礦模型屬性的概觀,以及描述您可以建立與使用採礦模型的方式。
Mining Model Architecture
Defining Mining Models
Mining Model Properties
Mining Model Columns
Processing Mining Models
Viewing and Querying Mining Models
採礦模型架構
資料採礦模型會從採礦結構取得資料,然後使用資料採礦演算法分析該資料。採礦結構與採礦模型是不同的物件。採礦結構會儲存定義資料來源的資訊。採礦模型會儲存資料統計處理衍生的資訊,例如,分析結果所發現的模式。
採礦模型在採礦結構提供的資料經過處理與分析前是空的。採礦模型經過處理之後,包含中繼資料、結果,以及回到採礦結構的繫結。
中繼資料會指定模型的名稱與儲存模型的伺服器,以及模型的定義,包括建立模型所使用之採礦結構的資料行清單、處理模型時套用之選擇性篩選的定義,以及分析資料所使用的演算法。資料行、篩選以及演算法的選擇都會大大影響分析的結果。例如,如果您使用相同的資料建立群集模型和決策樹模型,模型內容可能會非常不同,因為這些模型使用不同的演算法和篩選。如需詳細資訊,請參閱<採礦模型內容 (Analysis Services - 資料採礦)>。
儲存在模型中的結果會根據演算法而有所不同,但是可以包含模式、項目集、規則與公式。這些結果可以用來進行預測。
儲存在模型中的繫結會指回採礦結構中快取的資料。如果資料已經在結構中快取,而且尚未在處理後快取,這些繫結就可以讓您從結果向下鑽研到支援結果的案例。不過,實際的資料會儲存在結構快取中,而非模型中。
[回到頁首]
定義資料採礦模型
您可以使用下列步驟建立資料採礦模型:
建立基礎的採礦結構。
選取演算法。
指定模型資料行和使用方式。
選擇性地,設定演算法處理之微調的參數。
處理模型。
Analysis Services 提供下列工具協助您管理採礦模型:
資料採礦精靈可協助您建立結構與相關的採礦模型。這是最簡單的使用方法。此精靈會自動建立所需的採礦結構,並協助您設定重要的設定。
DMX CREATE MODEL 陳述式可用於定義模型。所需的結構會在處理程序中自動建立,因此,您無法搭配此方法重複使用現有的結構。如果您已經確切知道您要建立的模型,請使用這個方法。
DMX ALTER STRUCTURE ADD MODEL 陳述式可用於新的採礦模型加入到現有的結構。如果您要根據相同的資料集試驗不同的模型,請使用此方法。
您也可以使用 AMO 或 XML/A,或者使用適用於 Excel 之資料採礦用戶端之類的其他用戶端,透過程式設計方式建立採礦模型。如需詳細資訊,請參閱下列主題:
[回到頁首]
採礦模型屬性
每個採礦模型都擁有定義模型及其中繼資料的屬性。這些可能包括名稱、描述、上次處理模型的日期、模型的權限,以及用於定型之資料的任何篩選。
每個採礦模型也都擁有衍生自採礦結構的屬性,以及描述模型所使用資料之資料行的屬性。如果資料行是巢狀資料表,該資料行也可以套用個別的篩選。
此外,每個採礦模型都包含兩個特殊的屬性:Algorithm 和 Usage。
演算法屬性:指定建立模型所使用的演算法。可用的演算法取決於您所使用的提供者。如需 SQL ServerAnalysis Services 隨附之演算法的清單,請參閱<資料採礦演算法 (Analysis Services - 資料採礦)>。Algorithm 屬性會套用到採礦模型,而且每一個模型只能設定一次。您可以在稍後變更演算法,但是如果採礦模型中的某些資料行未受到您所選擇的演算法所支援,這些資料行可能會變成無效。此外,您一定要在變更之後重新處理模型。
Usage 屬性:定義此模型要如何使用每一個資料行。您可以將資料行使用方式定義為 Input、Predict、Predict Only 或 Key。Usage 屬性會套用到個別採礦模型,而且必須針對模型中所包含的每一個資料行來個別設定。如果此結構包含模型中未使用的資料行,使用方式會設定為 Ignore。
您可以在建立採礦模型後,變更採礦模型屬性的值。不過,即使是採礦模型名稱的任何變更都需要您重新處理模型。重新處理模型後,您可能會看到不同的結果。
[回到頁首]
採礦模型資料行
與採礦結構相同,採礦模型也會包含資料行。您可以從採礦結構中選擇要用於模型的資料行。除了使用基礎採礦結構中的資料行之外,您也可以建立採礦結構資料行的複本,然後為其重新命名或變更其用法。
根據您選擇的演算法,採礦結構中的某些資料行可能與模型不相容,或可能導致不良的結果。您應該仔細檢閱結構中的資料,而且只將對分析有意義的資料行加入到模型中。如果您認為不應該使用資料行,就不需要從採礦結構或採礦模型中刪除,但是您可以在資料行上,只設定一個旗標,指定在建立模型時應該忽略該資料行。也就是說,該資料行仍會保留在採礦結構中,但不會用於採礦模型中,不過,如果可以從模型向下鑽研到採礦結構,您可以稍後從該資料行擷取資訊。
建立模型之後,您就可以進行變更,例如,加入或移除資料行,或變更模型的名稱。不過,即使只是模型中繼資料的任何變更都需要您重新處理模型。
如需詳細資訊,請參閱<採礦結構資料行>和<採礦模型資料行>。
[回到頁首]
處理採礦模型
資料採礦模型在處理之前是一個空物件。當您處理模型時,如果有在模型中定義篩選,而且經過演算法分析,結構所快取的資料會透過該篩選傳遞。演算法會識別資料內的規則和模式,然後使用這些規則和模式來擴展模型。如需有關如何使用演算法來建立採礦模型的詳細資訊,請參閱<資料採礦演算法 (Analysis Services - 資料採礦)>。
採礦模型經過處理之後,也會儲存分析結果的相關資訊。如需有關儲存在儲存模型中資料種類的詳細資訊,請參閱<採礦模型內容 (Analysis Services - 資料採礦)>。
[回到頁首]
檢視和查詢採礦模型
在您處理模型之後,就可以使用 Business Intelligence Development Studio 和 SQL Server Management Studio 中提供的自訂檢視器來瀏覽該模型。如需有關 Analysis Services 中之自訂檢視器的詳細資訊,請參閱<檢視資料採礦模型>。
您也可以根據採礦模型建立查詢以進行預測,或者擷取模型中繼資料或模型建立的模式。您可以使用資料採礦擴充模組 (DMX) 建立查詢。如需針對資料採礦模型使用不同類型查詢的資訊,請參閱<查詢資料採礦模型 (Analysis Services - 資料採礦)>。