邏輯架構 (Analysis Services - 數據採礦)
適用於: SQL Server 2019 和舊版 Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
重要
SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性。
數據採礦是牽涉到多個元件互動的程式。
您可以存取 SQL Server 資料庫中的數據源或任何其他數據源,以用於定型、測試或預測。
您可以使用 SQL Server Data Tools 或 Visual Studio 來定義數據採礦結構和模型。
您可以使用 SQL Server Management Studio 來管理數據採礦物件,並建立預測和查詢。
解決方案完成時,您會將其部署至 SQL Server Analysis Services 的實例。
建立這些解決方案物件的程式已在其他地方描述。 如需詳細資訊,請參閱
下列各節說明數據採礦解決方案中對象的邏輯架構。
數據採礦源數據
您在數據採礦中使用的數據不會儲存在數據採礦解決方案中;只會儲存系結。 數據可能位於舊版 SQL Server、CRM 系統,甚至是一般檔案中建立的資料庫。 當您透過處理來定型結構或模型時,會建立數據的統計摘要,並儲存在快取中,以供稍後的作業使用,或在處理之後刪除。 如需詳細資訊,請參閱 採礦結構 (Analysis Services - 數據採礦)。
您會在 SQL Server Analysis Services 數據源檢視 (DSV) 對象中結合不同的數據,該物件會在數據源之上提供抽象層。 您可以指定數據表之間的聯結,或加入具有多對一關聯性的數據表,以建立巢狀數據表數據行。 這些物件的定義、數據源和數據源檢視會儲存在擴展名為 *.ds 和 *.dsv 的解決方案中。 如需建立和使用 SQL Server Analysis Services 數據源和數據源檢視的詳細資訊,請參閱 支持的數據來源 (SSAS - 多維度)。
您也可以使用 AMO 或 XMLA 來定義和改變資料源和資料源檢視。 如需以程式設計方式使用這些物件的詳細資訊,請參閱 邏輯架構概觀 (Analysis Services - 多維度數據)。
採礦結構
數據採礦結構是邏輯數據容器,定義採礦模型建置來源的數據域。 單一採礦結構可以支援多個採礦模型。
當您需要使用數據採礦解決方案中的數據時,Analysis Services 會從來源讀取數據,併產生匯總和其他資訊的快取。 根據預設,此快取會保存,以便重複使用定型數據以支援其他模型。 如果您需要刪除快取,請將採礦結構物件上的 CacheMode 屬性變更為 值,ClearAfterProcessing。 如需詳細資訊,請參閱 AMO 資料採礦類別。
Analysis Services 也可讓您將數據分成定型和測試數據集,讓您可以在代表性、隨機選取的數據集上測試採礦模型。 數據實際上不會分開儲存;相反地,結構快取中的案例數據會標示為 屬性,指出該特定案例是用於定型還是用於測試。 如果刪除快取,就無法擷取該資訊。
如需詳細資訊,請參閱 採礦結構 (Analysis Services - 數據採礦)。
數據採礦結構可以包含巢狀數據表。 巢狀數據表提供有關主要數據表中模型化案例的其他詳細數據。 如需詳細資訊,請參閱 巢狀數據表 (Analysis Services - 數據採礦)
採礦模型
在處理之前,數據採礦模型只是元數據屬性的組合。 這些屬性會指定採礦結構、指定數據採礦演算法,以及定義影響數據處理方式的參數和篩選設定集合。 如需詳細資訊,請參閱 採礦模型(Analysis Services - 數據採礦)。
當您處理模型時,儲存在採礦結構快取中的定型數據會根據數據的統計屬性和演算法及其參數所定義的啟發學習法,來產生模式。 這稱為模型 定型。
定型的結果是一組摘要數據,包含在 模型內容中,其中描述找到的模式,並提供產生預測的規則。 如需詳細資訊,請參閱 採礦模型內容(Analysis Services - 數據採礦)。
在有限的情況下,模型邏輯結構也可以匯出至檔案,以根據標準格式,預測性模型標記語言 (PMML) 來代表模型公式和數據系結。 此邏輯結構可以匯入到使用 PMML 的其他系統,並接著將描述的模型用於預測。 如需詳細資訊,請參閱 瞭解 DMX Select 語句。
自訂數據採礦物件
您在數據採礦項目內容中使用的其他物件,例如精確度圖表或預測查詢,不會保存在解決方案中,但可以使用 ASSL 編寫腳本,或使用 AMO 建置。
此外,您可以藉由新增下列自定義物件,來擴充 SQL Server Analysis Services 實例上可用的服務和功能:
自定義元件
您可以使用任何 CLR 或 COM 投訴語言來定義 .NET 元件,然後向 SQL Server 實例註冊。 元件檔案會從應用程式所定義的位置載入,而且複本會連同數據一起儲存在伺服器中。 每次啟動服務時,會使用元件檔案的復本來載入元件。
如需詳細資訊,請參閱 多維度模型元件管理。
自定義預存程式
SQL Server Analysis Services 數據採礦支援使用預存程式來處理數據採礦物件。 您可以建立自己的預存程式來擴充功能,並更輕鬆地處理預測查詢和內容查詢所傳回的數據。
支援下列預存程式來執行交叉驗證。
數據採礦預存程式 (Analysis Services - 數據採礦)
此外,SQL Server Analysis Services 包含許多內部用於數據採礦的系統預存程式。 雖然系統預存程式供內部使用,但您可能會發現它們很有用的快捷方式。 Microsoft保留視需要變更這些預存程序的權利;因此,針對生產環境使用,建議您使用 DMX、AMO 或 XMLA 來建立查詢。
自定義外掛程式演演算法
SQL Server Analysis Services 提供建立您自己的演算法的機制,然後將演算法新增為新的數據採礦服務至伺服器實例。
Analysis Services 會使用 COM 介面來與外掛程式演算法通訊。 若要深入瞭解如何實作新的演算法,請參閱 外掛程式演演算法。
您必須先註冊每個新的演算法,才能使用它。 若要註冊演算法,您可以在 SQL Server Analysis Services 實例的 .ini 檔案中新增演算法的必要元數據。 您必須將資訊新增至您計劃使用新演算法的每個實例。 新增演算法之後,您可以重新啟動 實例,並使用MINING_SERVICES架構數據列集來檢視新的演算法,包括演算法所支援的選項和提供者。
另請參閱
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應