數據採礦演算法是一組啟發學習法和計算,可從數據建立數據採礦模型。 為了建立模型,演算法會先分析您提供的數據,尋找特定類型的模式或趨勢。 此演算法會使用此分析的結果來定義建立採礦模型的最佳參數。 然後,這些參數會套用到整個數據集,以擷取可採取動作的模式和詳細的統計數據。
演算法從您的數據建立的採礦模型可以採用各種形式,包括:
一組叢集,描述數據集中的案例如何相關。
預測結果的判定樹,並描述不同準則如何影響該結果。
預測銷售額的數學模型。
一組規則,描述產品如何在交易中群組在一起,以及產品一起購買的可能性。
Microsoft SQL Server Analysis Services 提供多個演算法,以用於數據採礦解決方案。 這些演算法是一些在數據採礦中使用的最常用方法的實作。 所有Microsoft數據採礦演算法都可以自定義,而且可以使用提供的 API 完全程式化,或使用 SQL Server Integration Services 中的數據採礦元件進行完整程式化。
您也可以使用符合 OLE DB for Data Mining 規格的第三方演算法,或開發可註冊為服務的自定義演算法,然後在 SQL Server 數據採礦架構中使用。
選擇正確的演算法
選擇最適合用於特定分析工作的演算法可能是一項挑戰。 雖然您可以使用不同的演算法來執行相同的商務工作,但每個演算法會產生不同的結果,而某些演算法可能會產生多個類型的結果。 例如,您可以不僅使用Microsoft判定樹演算法進行預測,還可以作為減少數據集中數據行數目的方法,因為判定樹可以識別不會影響最終採礦模型的數據行。
依類型選擇演算法
Analysis Services 包含下列演算法類型:
分類演算法會 根據數據集中的其他屬性來預測一或多個離散變數。
回歸演算法會 根據數據集中的其他屬性預測一或多個連續變數,例如收益或損失。
分割演算法會將 數據分割成具有類似屬性的專案群組或叢集。
關聯演算法會 尋找數據集中不同屬性之間的相互關聯。 這種演算法最常見的應用是建立關聯規則,可用於購物籃分析。
時序分析演算法會 摘要數據中的頻繁序列或情節,例如 Web 路徑流程。
不過,您的解決方案中不必侷限於一個演算法。 經驗豐富的分析師有時會使用一種演算法來判斷最有效的輸入(也就是變數),然後套用不同的演算法,根據該數據預測特定結果。 SQL Server 數據採礦可讓您在單一採礦結構上建置多個模型,因此在單一數據採礦解決方案中,您可以使用叢集演算法、判定樹模型和貝氏機率模型來取得數據的不同檢視。 您也可以在單一解決方案內使用多個演算法來執行個別的工作:例如,您可以使用回歸來取得財務預測,並使用神經網路演算法來執行影響銷售的因素分析。
依工作選擇演算法
為了協助您選取與特定工作搭配使用的演算法,下表提供每個演算法傳統上使用之工作類型的建議。
| 工作的範例 | 要使用的Microsoft演算法 |
|---|---|
|
預測離散屬性 將潛在買家清單中的客戶標記為良好或不佳的潛力。 計算伺服器在未來 6 個月內失敗的機率。 分類患者結果並探索相關因素。 |
Microsoft判定樹演算法 Microsoft朴素貝氏演算法 Microsoft叢集演算法 Microsoft類神經網路演算法 |
|
預測連續屬性 預測明年的銷售量。 根據過去的歷史和季節性趨勢來預測網站訪客。 產生給定人口統計的風險分數。 |
Microsoft判定樹演算法 Microsoft時間序列演算法 Microsoft線性回歸演算法 |
|
預測序列 執行公司網站的點擊流分析。 分析導致伺服器失敗的因素。 擷取和分析門診訪問期間的活動順序,以制定常見活動的最佳作法。 |
Microsoft時序群集演算法 |
|
在交易中尋找常見項目的群組 使用市場籃分析來確定產品擺放位置。 建議客戶購買其他產品。 分析訪客到活動的調查數據,以找出哪些活動或展臺相互關聯,以規劃未來的活動。 |
Microsoft關聯演算法 Microsoft判定樹演算法 |
|
尋找類似專案的群組 根據人口統計和行為等屬性建立患者風險檔案的群組。 透過瀏覽和購買行為模式分析使用者。 識別具有類似使用特性的伺服器。 |
Microsoft叢集演算法 Microsoft時序群集演算法 |
相關內容
下表提供 Analysis Services 中每個數據採礦演算法學習資源的連結:
相關工作
| 主題 | 說明 |
|---|---|
| 判斷數據採礦模型所使用的演算法 | 查詢用來建立採礦模型的參數 |
| 建立自定義 Plug-In 演算法 | 外掛程式演算法 |
| 使用演算法特定的查看器探索模型 | 數據採礦模型查看器 |
| 使用泛型數據表格式檢視模型的內容 | 使用Microsoft一般內容樹檢視器流覽模型 |
| 瞭解如何設定數據並使用演算法來建立模型 |
採礦結構 (Analysis Services - 數據採礦) 採礦模型 (Analysis Services - 資料採礦) |