邏輯架構 (Analysis Services – 資料採礦)
適用于:SQL Server 2019 和更早版本的 Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
重要
資料採礦自 SQL Server 2017 Analysis Services 起退場,現在的 SQL Server 2022 Analysis Services 已不再繼續提供。 已退場和不再繼續提供之功能的文件不予更新。 若要深入了解,請參閱 Analysis Services 回溯相容性。
資料採礦是涉及多個元件互動的程序。
您可以存取 SQL Server 資料庫或任何其他資料來源中的資料來源,以供定型、測試或預測使用。
您可以使用 SQL Server Data Tools 或 Visual Studio 來定義資料採礦結構和模型。
您可以使用SQL Server Management Studio來管理資料採礦物件,並建立預測和查詢。
當解決方案完成時,您可以將它部署至 SQL Server Analysis Services 的實例。
其他地方已經描述建立這些方案物件的程序。 如需詳細資訊,請參閱 資料採礦方案。
下列章節描述資料採礦方案中物件的邏輯架構。
資料採礦來源資料
資料採礦方案中不會儲存用於資料採礦的資料,而只會儲存繫結。 資料可能位於以舊版的 SQL Server 所建立的資料庫、CRM 系統或甚至一般檔案中。 當您以處理方式來定型結構或模型時,便會建立資料的統計摘要,並將其儲存在快取中,該快取可以保留供之後的作業使用,或是在處理之後加以刪除。 如需詳細資訊,請參閱 Analysis Services (採礦結構 - 資料採礦) 。
您可以在SQL Server Analysis Services資料來源檢視中結合不同的資料, (DSV) 物件,以提供資料來源頂端的抽象層。 您可以在資料表之間指定聯結,或是加入具有多對一關聯性的資料表,以建立巢狀資料表資料行。 這些物件的定義、資料來源和資料來源檢視會儲存在方案內,而且副檔名為 *.ds 和 *.dsv。 如需建立和使用SQL Server Analysis Services資料來源和資料來源檢視的詳細資訊,請參閱支援的資料來源 (SSAS - 多維度) 。
您也可以使用 AMO 或 XMLA 來定義及更改資料來源和資料來源檢視。 如需以程式設計方式使用這些物件的詳細資訊,請參閱 邏輯架構概觀 (Analysis Services - 多維度資料) 。
採礦結構
資料採礦結構是定義資料網域 (從中建立採礦模型) 的邏輯資料容器。 單一採礦結構可以支援多個採礦模型。
當您需要使用資料採礦方案中的資料時,Analysis Services 會從來源讀取資料,並產生彙總與其他資訊的快取。 預設會保存此快取,以便重複使用定型資料來支援其他模型。 如果您需要刪除快取,請將採礦結構物件上的 CacheMode 屬性變更為 ClearAfterProcessing值。 如需詳細資訊,請參閱 AMO 資料採礦類別。
Analysis Services 也可讓您將資料分成定型和測試資料集,讓您可以在代表性、隨機選取的資料集上測試採礦模型。 資料實際上並不會分開儲存,而是以某個屬性來標示結構快取中的案例資料,該屬性指出特定案例是否用於定型或測試。 如果快取遭到刪除,就無法擷取該資訊。
如需詳細資訊,請參閱 Analysis Services (採礦結構 - 資料採礦) 。
資料採礦結構可以包含巢狀資料表。 巢狀資料表會提供有關主要資料表中模型化之案例的詳細資料。 如需詳細資訊,請參閱 巢狀資料表 (Analysis Services - 資料採礦)
採礦模型
在處理之前,資料採礦模型只是中繼資料屬性的組合。 這些屬性會指定採礦結構、指定資料採礦演算法,以及定義對資料處理方法造成影響之參數和篩選設定的集合。 如需詳細資訊,請參閱 Analysis Services (採礦模型 - 資料採礦) 。
當您處理模型時,儲存在採礦結構快取中的定型資料會用來產生模式 (根據資料的統計屬性以及演算法和其參數所定義的啟發學習法)。 這稱為 訓練 模型。
定型的結果是包含在「模型內容」中的一組摘要資料,可描述所找到的模式並提供產生預測所根據的規則。 如需詳細資訊,請參閱 Mining Model Content (Analysis Services - 資料採礦) 。
在受限的案例中,模型的邏輯結構也可以匯出到檔案中,該檔案代表根據標準格式 (預測模型標記語言,PMML) 的模型公式與資料繫結。 這個邏輯結構可以匯入到利用 PMML 的其他系統中,然後這樣的模型可用來預測。 如需詳細資訊,請參閱 了解 DMX Select 陳述式。
自訂資料採礦物件
您在資料採礦專案內容中使用的其他物件 (例如精確度圖表或預測查詢) 不會保存在方案中,但是可以使用 ASSL 撰寫指令碼或使用 AMO 來建立。
此外,您可以藉由新增下列自訂物件,來擴充實例上可用的服務和功能SQL Server Analysis Services:
自訂群組件
.NET 組件可以使用任何 CLR 或 COM 相容的語言來定義,然後向 SQL Server 執行個體註冊。 組件檔案會從應用程式定義的位置載入,而且會將複本連同資料儲存在伺服器中。 組件檔案的複本是用在每次啟動服務時載入組件。
如需詳細資訊,請參閱 多維度模型組件管理。
自訂預存程序
SQL Server Analysis Services資料採礦支援使用預存程式來處理資料採礦物件。 您可以建立自己的預存程序來擴充功能,並更輕鬆地處理預測查詢和內容查詢所傳回的資料。
執行交叉驗證時支援使用下列預存程序。
資料採礦預存程序 (Analysis Services - 資料採礦)
此外,SQL Server Analysis Services包含許多用於資料採礦內部的系統預存程式。 雖然系統預存程序供內部使用,但是您可能會發現這些是非常實用的捷徑。 Microsoft 保留視需要變更這些預存程序的權利;因此在實際使用上,我們建議您最好使用 DMX、AMO 或 XMLA 建立查詢。
建立外掛程式演算法
SQL Server Analysis Services提供建立您自己的演算法的機制,然後將演算法新增為新的資料採礦服務至伺服器實例。
Analysis Services 會使用 COM 介面與外掛程式演算法通訊。 若要深入了解如何實作新的演算法,請參閱 外掛程式演算法。
您必須先註冊每一個新的演算法,然後才能使用。 若要註冊演算法,請在 SQL Server Analysis Services 實例的 .ini 檔案中新增演算法的必要中繼資料。 您必須在您打算使用新演算法的每一個執行個體中加入該資訊。 在您加入演算法之後,您可以重新啟動執行個體,然後使用 MINING_SERVICES 結構描述資料列集來檢視新的演算法,包括演算法所支援的選項和提供者。
另請參閱
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應