共用方式為


數據採礦專案

適用於: SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性

數據採礦專案是 SQL Server Analysis Services 解決方案的一部分。 在設計過程中,您在此專案中建立的物件可用於在工作區資料庫中進行測試和查詢。 當您想要讓使用者能夠查詢或瀏覽專案中的物件時,您必須將專案部署到以多維度模式執行的 SQL Server Analysis Services 實例。

本主題提供您瞭解和建立數據採礦專案所需的基本資訊。

建立數據採礦專案

數據採礦專案中 物件

使用已完成的數據採礦專案

以程式設計方式存取數據採礦專案

建立數據採礦專案

在 SQL Server Data Tools 中,您可以使用範本建置資料採礦專案,OLAP 和數據採礦專案。 您也可以使用 AMO,以程式設計方式建立數據採礦專案。 您可以使用 Analysis Services 腳本語言 (ASSL) 編寫個別數據採礦物件的腳本。 如需詳細資訊,請參閱 多維度模型數據存取(Analysis Services - 多維度數據)

如果您在現有的方案內建立數據採礦專案,則數據採礦對象預設會部署至與方案檔同名的 SQL Server Analysis Services 資料庫。 您可以使用 [項目屬性] 對話框來變更此名稱和目標伺服器。 如需詳細資訊,請參閱 設定 Analysis Services 專案屬性 (SSDT)

警告

若要成功建置和部署您的專案,您必須能夠存取在 OLAP/數據採礦模式中執行的 SQL Server Analysis Services 實例。 您無法在支援表格式模型的 SQL Server Analysis Services 實例上開發或部署數據採礦解決方案,也無法直接從 Power Pivot 活頁簿或使用記憶體內部數據存放區的表格式模型使用數據。 若要判斷您擁有的 SQL Server Analysis Services 實例是否支援數據採礦,請參閱 判斷 Analysis Services 實例的伺服器模式

在您建立的每個數據採礦專案中,您將遵循下列步驟:

  1. 選擇 數據源,例如 Cube、資料庫,甚至是 Excel 或文本檔,其中包含您將用來建置模型的原始數據。

  2. 定義資料來源中要用於分析的數據子集,並將它儲存為 數據源檢視

  3. 定義 採礦結構 以支援模型化。

  4. 選擇 演算法 並指定演算法如何處理數據,將 採礦模型 新增至採礦結構。

  5. 使用選取的數據填入模型,或篩選過的數據子集來定型模型。

  6. 探索、測試和重建模型。

專案完成時,您可以部署它供使用者瀏覽或查詢,或提供應用程式採礦模型的程式設計存取,以支援預測和分析。

數據採礦專案中的物件

所有數據採礦專案都包含下列四種物件類型。 您可以有多個類型的物件。

  • 數據源

  • 數據源檢視

  • 採礦結構

  • 採礦模型

例如,單一數據採礦專案可以包含多個數據源的參考,每個數據源都支援多個數據源檢視。 接著,每個數據源檢視都可以支援多個採礦結構,每個結構都有許多相關的採礦模型。

此外,您的專案可能包含外掛程式演算法、自定義元件或自定義預存程式;不過,此處不會描述這些物件。 如需詳細資訊,請參閱 Analysis Services 開發人員檔

數據源

數據源會定義 SQL Server Analysis Services 伺服器將用來連接到數據源的連接字串和驗證資訊。 數據源可以包含多個數據表或檢視;它可以像單一 Excel 活頁簿或文本檔一樣簡單,或與在線分析處理 (OLAP) 資料庫或大型關係資料庫一樣複雜。

單一數據採礦專案可以參考多個數據源。 雖然採礦模型一次只能使用一個數據源,但專案可能會有多個模型繪製在不同的數據源上。

SQL Server Analysis Services 支援來自許多外部提供者的數據,而 SQL Server 數據採礦可以使用關係型和 Cube 數據做為數據源。 不過,如果您根據關係型來源和以 OLAP Cube 為基礎的模型開發這兩種類型的專案模型,您可能想要在不同的項目中開發和管理這些專案。

  • 通常,以 OLAP Cube 為基礎的模型應該在 OLAP 設計解決方案內開發。 其中一個原因是,以 Cube 為基礎的模型必須處理 Cube 以更新數據。 一般而言,只有當這是數據儲存和存取的主要方法時,或當您需要多維度專案所建立的匯總、維度和屬性時,才應該使用 Cube 數據。

  • 如果您的專案只使用關係型數據,您應該在個別專案中建立關係型模型,這樣您就不會不必要地重新處理其他物件。 在許多情況下,用來支援 Cube 建立的暫存資料庫或數據倉儲已經包含執行數據採礦所需的檢視,而且您可以將這些檢視用於數據採礦,而不是使用 Cube 中的匯總和維度。

  • 您無法直接使用記憶體內部或 Power Pivot 數據來建置數據採礦模型。

數據源只會識別伺服器或提供者和一般數據類型。 如果您需要變更數據格式和匯總,請使用數據源檢視物件。

若要控制數據源中的數據處理方式,您可以加入衍生的數據行或計算、修改匯總,或重新命名數據源檢視中的數據行。 (您也可以使用下游的數據、修改採礦結構數據行,或使用採礦模型數據行層級的模型旗標和篩選。

如果需要數據清理,或數據倉儲中的數據必須修改以建立其他變數、變更數據類型或建立替代匯總,您可能需要建立其他專案類型以支持數據採礦。 如需這些相關項目的詳細資訊,請參閱 數據採礦解決方案的相關專案

數據源檢視

定義與數據源的這個連線之後,您會建立一個檢視,以識別與模型相關的特定數據。

數據源檢視也可讓您自定義數據源中的數據提供給採礦模型的方式。 您可以修改數據的結構,使其與您的專案更相關,或只選擇特定種類的數據。

例如,使用 [資料源檢視] 編輯器,您可以:

  • 建立衍生的數據行,例如 dateparts、substrings 等等。

  • 使用 GROUP BY 等 Transact-SQL 語句匯總值

  • 暫時限制數據,或範例數據

如需如何在資料源檢視中修改資料的詳細資訊,請參閱多維度模型中 數據源檢視

警告

如果您想要篩選數據,您可以在數據源檢視中執行此動作,但您也可以在採礦模型層級的數據上建立篩選。 由於篩選定義是與採礦模型一起儲存,所以使用模型篩選可讓您更輕鬆地判斷用於定型模型的數據。 此外,您可以使用不同的篩選準則來建立多個相關模型。 如需詳細資訊,請參閱 採礦模型的篩選 (Analysis Services - 數據採礦)

請注意,您所建立的數據源檢視可以包含未直接用於分析的其他數據。 例如,您可以將 新增至用於測試、預測或鑽研的數據源檢視數據。 如需這些用法的詳細資訊,請參閱 測試和驗證(數據採礦)鑽研

採礦結構

建立數據源和數據源檢視之後,您必須定義專案中 採礦結構,以選取與您商務問題最相關的數據行。 採礦結構會告訴專案,數據源檢視中的數據行應該實際用於模型、定型和測試。

若要新增採礦結構,請啟動 [數據採礦精靈]。 精靈會自動定義採礦結構、逐步引導您完成選擇數據的程式,並選擇性地讓您將初始採礦模型新增至 結構。 在採礦結構中,您可以選擇數據源檢視或 OLAP Cube 中的數據表和數據行,並在數據報含巢狀數據表時定義數據表之間的關聯性。

根據您使用關係型或在線分析處理 (OLAP) 數據源而定,您選擇的數據在數據採礦精靈中看起來會大不相同。

  • 當您從關係型數據源選擇數據時,設定採礦結構很簡單:您可以從數據源檢視中的數據選擇數據行,以及設定其他自定義專案,例如別名,或定義數據行中的值應該如何分組或量化。 如需詳細資訊,請參閱 建立關係型採礦結構

  • 當您使用 OLAP Cube 中的數據時,採礦結構必須與 OLAP 解決方案位於相同的資料庫中。 若要建立採礦結構,您可以從 OLAP 解決方案中的維度和相關量值中選取屬性。 數值通常可在量值中找到,而維度中的類別變數則為 。 如需詳細資訊,請參閱 建立 OLAP 採礦結構

  • 您也可以使用 DMX 來定義採礦結構。 如需詳細資訊,請參閱數據採礦延伸模組 (DMX) 數據定義語句。

建立初始採礦結構之後,您可以複製、修改和別名結構數據行。

每個採礦結構都可以包含多個採礦模型。 因此,完成之後,您可以再次開啟採礦結構,並使用 數據採礦設計工具 將更多採礦模型新增至 結構。

您也可以選擇將數據分成定型數據集、用於建置模型,以及用來測試或驗證採礦模型的鑒效組數據集。

警告

某些模型類型,例如時間序列模型,不支援建立鑒效組數據集,因為它們需要連續的數列數據來進行定型。 如需詳細資訊,請參閱 定型及測試資料集

採礦模型

採礦模型會定義演算法,或您將用於數據的分析方法。 在每個採礦結構中,您會新增一或多個採礦模型。

視您的需求而定,您可以在單一專案中結合許多模型,或為每個模型或分析工作類型建立個別的專案。

建立結構和模型之後,您 透過演算法執行數據源檢視中的數據,以 每個模型,以產生數據的數學模型。 此程式也稱為 將模型定型。 如需詳細資訊,請參閱 處理需求和考慮(資料採礦)

處理模型之後,您就可以以可視化方式探索採礦模型,並針對它建立預測查詢。 如果已快取定型程式中的數據,您可以使用 鑽研 查詢,傳回模型中所使用案例的詳細資訊。

當您想要將模型用於生產環境時(例如,用於進行預測,或供一般使用者探索),您可以將模型部署到不同的伺服器。 如果您需要在未來重新處理模型,您也必須同時匯出基礎採礦結構的定義(而且一定是數據源和數據源檢視的定義)。

當您部署模型時,也必須確保結構與模型上已設定正確的處理選項,且潛在使用者具有執行查詢、檢視模型或鑽研以建構 o 模型數據所需的許可權。 如需詳細資訊,請參閱 安全性概觀 (資料採礦)

使用已完成的數據採礦專案

本節摘要說明您可以使用已完成的數據採礦專案的方式。 您可以建立精確度圖表、探索和驗證數據,以及讓使用者可以使用數據採礦模式。

警告

您搭配數據採礦模型使用的圖表、查詢和視覺效果不會儲存為數據採礦專案的一部分,而且無法部署。 如果您需要保存這些物件,您必須儲存呈現的內容或編寫腳本,如每個物件所述。

檢視和探索模型

建立模型之後,您可以使用可視化工具和查詢來探索模型中的模式,並深入了解基礎模式和統計數據。 在數據採礦設計師中的 [採礦模型查看器] 索引卷標上,SQL Server Analysis Services 會為每個採礦模型類型提供檢視者,供您用來探索採礦模型。

這些視覺效果是暫時的,當您使用 SQL Server Analysis Services 結束會話時,會關閉而不儲存。 因此,如果您需要將這些視覺效果匯出至另一個應用程式以進行簡報或進一步分析,請使用 複製 命令提供於查看器介面的每個索引卷標或窗格中。

適用於 Excel 的數據採礦載入宏也提供 Visio 範本,可讓您用來代表 Visio 圖表中的模型,並使用 Visio 工具標註和修改圖表。 如需詳細資訊,請參閱 Microsoft SQL Server 2008 SP2 Data Mining Add-ins for Microsoft Office 2007

測試和驗證模型

建立模型之後,您可以調查結果,並決定哪些模型執行得最好。

SQL Server Analysis Services 提供數個圖表,可用來提供可用來直接比較採礦模型的工具,並選擇最精確或最有用的採礦模型。 這些工具包括增益圖、收益圖和分類矩陣。 您可以使用數據採礦設計師 索引標籤 採礦精確度圖表來產生這些圖表。

您也可以使用交叉驗證報告來執行數據的反覆子取樣,以判斷模型是否偏向於特定數據集。 報表提供的統計數據可用來客觀比較模型並評估定型數據的品質。

請注意,這些報表和圖表不會與專案或ssASnoversion資料庫一起儲存,因此如果您需要保留或複製結果,您應該儲存結果,或使用 DMX 或 AMO 撰寫物件腳本。 您也可以使用預存程式進行交叉驗證。

如需詳細資訊,請參閱 測試和驗證 (資料採礦)

建立預測

SQL Server Analysis Services 提供稱為數據採礦延伸模組 (DMX) 的查詢語言,這是建立預測的基礎,而且很容易編寫腳本。 為了協助您建置 DMX 預測查詢,SQL Server 提供 SQL Server Management Studio 中提供的查詢產生器。 SQL Server Management Studio 中查詢編輯器也有許多 DMX 範本。如果您不熟悉預測查詢,建議您使用數據採礦設計師和 SQL Server Management Studio 中提供的查詢產生器。 如需詳細資訊,請參閱 資料採礦工具

您在 SQL Server Data Tools 或 SQL Server Management Studio 中建立的預測不會保存,因此如果您的查詢很複雜,或您需要重現結果,建議您將預測查詢儲存至 DMX 查詢檔案、編寫腳本,或將查詢內嵌為 Integration Services 套件的一部分。

以程式設計方式存取數據採礦物件

SQL Server Analysis Services 提供數個工具,可讓您以程式設計方式處理數據採礦專案及其中的物件。 DMX 語言提供語句,可讓您用來建立數據源和數據源檢視,以及建立、定型和使用數據採礦結構和模型。 如需詳細資訊,請參閱 資料採礦延伸模組 (DMX) 參考

您也可以使用 Analysis Services 腳本語言 (ASSL), 或使用分析管理物件 (AMO) 來執行這些工作。 如需詳細資訊,請參閱 Analysis Services中使用 XMLA 進行開發。

下列主題描述如何使用數據採礦精靈來建立數據採礦專案和相關聯的物件。

任務 主題
描述如何使用採礦結構數據行 建立關係型採礦結構
提供有關如何新增採礦模型,以及處理結構和模型的詳細資訊 將採礦模型新增至結構 (Analysis Services - 數據採礦)
提供資源的連結,可協助您自定義建置採礦模型的演算法 自定義採礦模型和結構
提供每個採礦模型查看器相關信息的連結 數據採礦模型查看器
瞭解如何建立增益圖、收益圖或分類矩陣,或測試採礦結構 測試和驗證 (資料採礦)
瞭解處理選項和許可權 處理數據採礦物件
提供 Analysis Services 的詳細資訊 多維度模型資料庫

另請參閱

數據採礦設計工具
使用 SQL Server Data Tools 建立多維度模型
工作區資料庫