共用方式為


資料採礦演算法 (Analysis Services - 數據採礦)

數據採礦演算法是一組啟發學習法和計算,可從數據建立數據採礦模型。 為了建立模型,演算法會先分析您提供的數據,尋找特定類型的模式或趨勢。 此演算法會使用此分析的結果來定義建立採礦模型的最佳參數。 然後,這些參數會套用到整個數據集,以擷取可採取動作的模式和詳細的統計數據。

演算法從您的數據建立的採礦模型可以採用各種形式,包括:

  • 一組叢集,描述數據集中的案例如何相關。

  • 預測結果的判定樹,並描述不同準則如何影響該結果。

  • 預測銷售額的數學模型。

  • 一組規則,描述產品如何在交易中群組在一起,以及產品一起購買的可能性。

Microsoft SQL Server Analysis Services 提供多個演算法,以用於數據採礦解決方案。 這些演算法是一些在數據採礦中使用的最常用方法的實作。 所有Microsoft數據採礦演算法都可以自定義,而且可以使用提供的 API 完全程式化,或使用 SQL Server Integration Services 中的數據採礦元件進行完整程式化。

您也可以使用符合 OLE DB for Data Mining 規格的第三方演算法,或開發可註冊為服務的自定義演算法,然後在 SQL Server 數據採礦架構中使用。

選擇正確的演算法

選擇最適合用於特定分析工作的演算法可能是一項挑戰。 雖然您可以使用不同的演算法來執行相同的商務工作,但每個演算法會產生不同的結果,而某些演算法可能會產生多個類型的結果。 例如,您可以不僅使用Microsoft判定樹演算法進行預測,還可以作為減少數據集中數據行數目的方法,因為判定樹可以識別不會影響最終採礦模型的數據行。

依類型選擇演算法

Analysis Services 包含下列演算法類型:

  • 分類演算法會 根據數據集中的其他屬性來預測一或多個離散變數。

  • 回歸演算法會 根據數據集中的其他屬性預測一或多個連續變數,例如收益或損失。

  • 分割演算法會將 數據分割成具有類似屬性的專案群組或叢集。

  • 關聯演算法會 尋找數據集中不同屬性之間的相互關聯。 這種演算法最常見的應用是建立關聯規則,可用於購物籃分析。

  • 時序分析演算法會 摘要數據中的頻繁序列或情節,例如 Web 路徑流程。

不過,您的解決方案中不必侷限於一個演算法。 經驗豐富的分析師有時會使用一種演算法來判斷最有效的輸入(也就是變數),然後套用不同的演算法,根據該數據預測特定結果。 SQL Server 數據採礦可讓您在單一採礦結構上建置多個模型,因此在單一數據採礦解決方案中,您可以使用叢集演算法、判定樹模型和貝氏機率模型來取得數據的不同檢視。 您也可以在單一解決方案內使用多個演算法來執行個別的工作:例如,您可以使用回歸來取得財務預測,並使用神經網路演算法來執行影響銷售的因素分析。

依工作選擇演算法

為了協助您選取與特定工作搭配使用的演算法,下表提供每個演算法傳統上使用之工作類型的建議。

工作的範例 要使用的Microsoft演算法
預測離散屬性

將潛在買家清單中的客戶標記為良好或不佳的潛力。

計算伺服器在未來 6 個月內失敗的機率。

分類患者結果並探索相關因素。
Microsoft判定樹演算法

Microsoft朴素貝氏演算法

Microsoft叢集演算法

Microsoft類神經網路演算法
預測連續屬性

預測明年的銷售量。

根據過去的歷史和季節性趨勢來預測網站訪客。

產生給定人口統計的風險分數。
Microsoft判定樹演算法

Microsoft時間序列演算法

Microsoft線性回歸演算法
預測序列

執行公司網站的點擊流分析。

分析導致伺服器失敗的因素。

擷取和分析門診訪問期間的活動順序,以制定常見活動的最佳作法。
Microsoft時序群集演算法
在交易中尋找常見項目的群組

使用市場籃分析來確定產品擺放位置。

建議客戶購買其他產品。

分析訪客到活動的調查數據,以找出哪些活動或展臺相互關聯,以規劃未來的活動。
Microsoft關聯演算法

Microsoft判定樹演算法
尋找類似專案的群組

根據人口統計和行為等屬性建立患者風險檔案的群組。

透過瀏覽和購買行為模式分析使用者。

識別具有類似使用特性的伺服器。
Microsoft叢集演算法

Microsoft時序群集演算法

下表提供 Analysis Services 中每個數據採礦演算法學習資源的連結:

基本演算法描述 說明演算法的用途及其運作方式,並概述演算法可能很有用的可能商務案例。
Microsoft關聯演算法

Microsoft叢集演算法

Microsoft判定樹演算法

Microsoft線性回歸演算法

Microsoft羅吉斯回歸演算法

Microsoft朴素貝氏演算法

Microsoft類神經網路演算法

Microsoft時序群集演算法

Microsoft時間序列演算法
技術參考 視需要提供演算法實作的技術詳細數據,並提供學術參考。 列出您可以設定的參數,以控制演算法的行為,並在模型中自定義結果。 描述數據需求,並盡可能提供效能秘訣。
Microsoft關聯演算法技術參考

Microsoft叢集演算法技術參考

Microsoft判定樹演算法技術參考

Microsoft線性回歸演算法技術參考

Microsoft羅吉斯回歸演算法技術參考

Microsoft 樸素貝葉斯演算法技術參考

Microsoft類神經網路演算法技術參考

Microsoft時序群集演算法技術參考

Microsoft 時間序列演算法技術參考
模型內容 說明資訊如何在每種類型的數據採礦模型中結構化,並說明如何解譯儲存在每個節點中的資訊。
關聯模型的採礦模型內容 (Analysis Services - 數據採礦)

叢集模型的採礦模型內容 (Analysis Services - 數據採礦)

判定樹模型的採礦模型內容 (Analysis Services - 數據採礦)

線性回歸模型的採礦模型內容 (Analysis Services - 數據採礦)

羅吉斯回歸模型的採礦模型內容 (Analysis Services - 數據採礦)

樸素貝葉斯模型的採礦模型內容(Analysis Services - 資料探勘)

類神經網路模型的採礦模型內容 (Analysis Services - 數據採礦)

時序群集模型的採礦模型內容 (Analysis Services - 數據採礦)

時間序列模型的採礦模型內容 (Analysis Services - 數據採礦)
數據採礦查詢 提供可搭配每個模型類型使用的多個查詢。 範例包括內容查詢,可讓您深入瞭解模型中的模式,以及預測查詢,以協助您根據這些模式建置預測。
關聯模型查詢範例

叢集模型查詢範例

判定樹模型查詢範例

線性回歸模型查詢範例

羅吉斯回歸模型查詢範例

朴素貝氏模型查詢範例

類神經網路模型查詢範例

時序群集模型查詢範例

時間序列模型查詢範例
主題 說明
判斷數據採礦模型所使用的演算法 查詢用來建立採礦模型的參數
建立自定義 Plug-In 演算法 外掛程式演算法
使用演算法特定的查看器探索模型 數據採礦模型查看器
使用泛型數據表格式檢視模型的內容 使用Microsoft一般內容樹檢視器流覽模型
瞭解如何設定數據並使用演算法來建立模型 採礦結構 (Analysis Services - 數據採礦)

採礦模型 (Analysis Services - 資料採礦)

另請參閱

數據採礦工具