資料採礦演算法 (Analysis Services - 資料採礦)
「資料採礦演算法」(Data Mining Algorithm) 是一組啟發式和計算,可從資料建立資料採礦模型。 若要建立模型,演算法首先會分析您提供的資料,尋找特定模式和趨勢類型。 此演算法會使用此分析結果來定義用於建立採礦模型的最佳參數。 然後這些參數會套用到整個資料集以擷取可付諸行動的模式與詳細的統計資料。
演算法從資料建立的採礦模型可以有各種形式,包括:
一組叢集,描述資料集的案例如何相關。
決策樹,預測結果並描述不同準則如何影響該結果。
預測銷售的數學模型。
一組規則,描述交易中的產品及購買產品的機率如何群組在一起。
Microsoft SQL Server Analysis Services 提供多種演算法讓您在資料採礦方案中使用。 這些演算法是資料採礦中所使用之其中一些最常用方法的實作。 所有 Microsoft 資料採礦演算法都可以使用提供的 API,或使用 SQL Server Integration Services 中的資料採礦元件加以自訂及完整程式化。
您也可以使用符合 OLE DB for Data Mining 規格的協力廠商演算法,或開發可註冊為服務,然後用於 SQL Server 資料採礦架構中的自訂演算法。
選擇正確的演算法
選擇特定分析工作最適用的演算法並不容易。 您可以使用不同的演算法來執行相同的業務工作,每一個演算法會產生不同的結果,且部分演算法還會產生一種以上的結果類型。 例如,您可以使用 Microsoft 決策樹演算法,不僅用來預測也可以減少資料集內的資料行數目,因為決策樹可以識別不影響最終採礦模型的資料行。
依類型選擇演算法
Analysis Services 包括下列演算法類型:
分類演算法會根據資料集內的其他屬性,預測一個或多個分隔變數。
迴歸演算法會根據資料集內的其他屬性,預測一個或多個連續變數,例如利潤或損失。
分割演算法會將項目的資料劃分為具有相似屬性的群組或叢集。
關聯分析演算法會尋找資料集內的不同屬性之間的相互關聯。 這種演算法最常應用在建立關聯規則,這些規則可以用在購物籃分析。
時序分析演算法會摘要資料的時序或時段,例如 Web 路徑流程。
不過,沒有任何理由限制您在方案中只能使用一種演算法。 有經驗的分析師有時會使用一種演算法來決定最有效的輸入 (亦即變數),然後套用不同演算法,以根據該資料預測特定結果。 SQL Server 資料採礦可讓您根據單一採礦結構建立多種模型,因此在單一資料採礦方案內,您可以使用叢集演算法、決策樹模型及貝氏機率分類模型,來取得不同的資料檢視。 您也可以在一個方案內使用多種演算法來執行個別的工作:例如,您可以使用迴歸來取得財務預測,以及使用類神經網路演算法來執行影響銷售之因素的分析。
依工作選擇演算法
為了協助您選取搭配特定工作所使用的演算法,下表提供每種演算法傳統上使用的工作類型建議。
工作範例 |
適用的 Microsoft 演算法 |
---|---|
預測離散屬性
|
|
預測連續屬性
|
|
預測順序
|
|
在交易中尋找通用項目的群組
|
|
尋找相似項目的群組
|
相關內容
下表提供 Analysis Services 隨附之每種資料採礦演算法的學習資源連結:
基本演算法描述 |
說明演算法的用途與運作方式,並概要說明演算法可能相當實用的商務案例。 |
技術參考 |
提供有關演算法實作的技術詳細資料,並視需要提供學術參考。 列出您可以設定的參數,用於控制演算法的行為,並自訂模型中的結果。 描述資料需求,並盡可能提供效能提示。 |
模型內容 |
說明每種資料採礦模型類型中的資訊結構化方式,並說明如何解譯儲存在每個節點中的資訊。 |
關聯模型的採礦模型內容 (Analysis Services - 資料採礦) 群集模型的採礦模型內容 (Analysis Services - 資料採礦) 決策樹模型的採礦模型內容 (Analysis Services - 資料採礦) 線性迴歸模型的採礦模型內容 (Analysis Services - 資料採礦) 羅吉斯迴歸模型的採礦模型內容 (Analysis Services - 資料採礦) 貝氏機率分類模型的採礦模型內容 (Analysis Services - 資料採礦) 類神經網路模型的採礦模型內容 (Analysis Services - 資料採礦) |
|
資料採礦查詢 |
提供多項可用於每種模型類型的查詢。 例如,可讓您深入了解模型中模式的內容查詢,以及可協助您根據這些模式建立預測的預測查詢。 |
相關工作
主題 |
說明 |
---|---|
確定資料採礦模型所使用的演算法。 |
|
建立自訂外掛程式演算法 |
|
使用演算法特定的檢視器瀏覽模型 |
|
檢視使用一般資料表格式的模型內容 |
|
了解如何設定資料及使用演算法來建立模型 |