共用方式為


邏輯架構 (Analysis Services – 資料採礦)

適用于:SQL Server 2019 和更早版本的 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

資料採礦自 SQL Server 2017 Analysis Services 起退場,現在的 SQL Server 2022 Analysis Services 已不再繼續提供。 已退場和不再繼續提供之功能的文件不予更新。 若要深入了解,請參閱 Analysis Services 回溯相容性

資料採礦是涉及多個元件互動的程序。

  • 您可以存取 SQL Server 資料庫或任何其他資料來源中的資料來源,以供定型、測試或預測使用。

  • 您可以使用 SQL Server Data Tools 或 Visual Studio 來定義資料採礦結構和模型。

  • 您可以使用SQL Server Management Studio來管理資料採礦物件,並建立預測和查詢。

  • 當解決方案完成時,您可以將它部署至 SQL Server Analysis Services 的實例。

其他地方已經描述建立這些方案物件的程序。 如需詳細資訊,請參閱 資料採礦方案

下列章節描述資料採礦方案中物件的邏輯架構。

資料採礦來源資料

採礦結構

採礦模型

自訂資料採礦物件

資料採礦來源資料

資料採礦方案中不會儲存用於資料採礦的資料,而只會儲存繫結。 資料可能位於以舊版的 SQL Server 所建立的資料庫、CRM 系統或甚至一般檔案中。 當您以處理方式來定型結構或模型時,便會建立資料的統計摘要,並將其儲存在快取中,該快取可以保留供之後的作業使用,或是在處理之後加以刪除。 如需詳細資訊,請參閱 Analysis Services (採礦結構 - 資料採礦)

您可以在SQL Server Analysis Services資料來源檢視中結合不同的資料, (DSV) 物件,以提供資料來源頂端的抽象層。 您可以在資料表之間指定聯結,或是加入具有多對一關聯性的資料表,以建立巢狀資料表資料行。 這些物件的定義、資料來源和資料來源檢視會儲存在方案內,而且副檔名為 *.ds 和 *.dsv。 如需建立和使用SQL Server Analysis Services資料來源和資料來源檢視的詳細資訊,請參閱支援的資料來源 (SSAS - 多維度)

您也可以使用 AMO 或 XMLA 來定義及更改資料來源和資料來源檢視。 如需以程式設計方式使用這些物件的詳細資訊,請參閱 邏輯架構概觀 (Analysis Services - 多維度資料)

採礦結構

資料採礦結構是定義資料網域 (從中建立採礦模型) 的邏輯資料容器。 單一採礦結構可以支援多個採礦模型。

當您需要使用資料採礦方案中的資料時,Analysis Services 會從來源讀取資料,並產生彙總與其他資訊的快取。 預設會保存此快取,以便重複使用定型資料來支援其他模型。 如果您需要刪除快取,請將採礦結構物件上的 CacheMode 屬性變更為 ClearAfterProcessing值。 如需詳細資訊,請參閱 AMO 資料採礦類別

Analysis Services 也可讓您將資料分成定型和測試資料集,讓您可以在代表性、隨機選取的資料集上測試採礦模型。 資料實際上並不會分開儲存,而是以某個屬性來標示結構快取中的案例資料,該屬性指出特定案例是否用於定型或測試。 如果快取遭到刪除,就無法擷取該資訊。

如需詳細資訊,請參閱 Analysis Services (採礦結構 - 資料採礦)

資料採礦結構可以包含巢狀資料表。 巢狀資料表會提供有關主要資料表中模型化之案例的詳細資料。 如需詳細資訊,請參閱 巢狀資料表 (Analysis Services - 資料採礦)

採礦模型

在處理之前,資料採礦模型只是中繼資料屬性的組合。 這些屬性會指定採礦結構、指定資料採礦演算法,以及定義對資料處理方法造成影響之參數和篩選設定的集合。 如需詳細資訊,請參閱 Analysis Services (採礦模型 - 資料採礦)

當您處理模型時,儲存在採礦結構快取中的定型資料會用來產生模式 (根據資料的統計屬性以及演算法和其參數所定義的啟發學習法)。 這稱為 訓練 模型。

定型的結果是包含在「模型內容」中的一組摘要資料,可描述所找到的模式並提供產生預測所根據的規則。 如需詳細資訊,請參閱 Mining Model Content (Analysis Services - 資料採礦)

在受限的案例中,模型的邏輯結構也可以匯出到檔案中,該檔案代表根據標準格式 (預測模型標記語言,PMML) 的模型公式與資料繫結。 這個邏輯結構可以匯入到利用 PMML 的其他系統中,然後這樣的模型可用來預測。 如需詳細資訊,請參閱 了解 DMX Select 陳述式

自訂資料採礦物件

您在資料採礦專案內容中使用的其他物件 (例如精確度圖表或預測查詢) 不會保存在方案中,但是可以使用 ASSL 撰寫指令碼或使用 AMO 來建立。

此外,您可以藉由新增下列自訂物件,來擴充實例上可用的服務和功能SQL Server Analysis Services:

自訂群組件
.NET 組件可以使用任何 CLR 或 COM 相容的語言來定義,然後向 SQL Server 執行個體註冊。 組件檔案會從應用程式定義的位置載入,而且會將複本連同資料儲存在伺服器中。 組件檔案的複本是用在每次啟動服務時載入組件。

如需詳細資訊,請參閱 多維度模型組件管理

自訂預存程序
SQL Server Analysis Services資料採礦支援使用預存程式來處理資料採礦物件。 您可以建立自己的預存程序來擴充功能,並更輕鬆地處理預測查詢和內容查詢所傳回的資料。

定義預存程式

執行交叉驗證時支援使用下列預存程序。

資料採礦預存程序 (Analysis Services - 資料採礦)

此外,SQL Server Analysis Services包含許多用於資料採礦內部的系統預存程式。 雖然系統預存程序供內部使用,但是您可能會發現這些是非常實用的捷徑。 Microsoft 保留視需要變更這些預存程序的權利;因此在實際使用上,我們建議您最好使用 DMX、AMO 或 XMLA 建立查詢。

建立外掛程式演算法
SQL Server Analysis Services提供建立您自己的演算法的機制,然後將演算法新增為新的資料採礦服務至伺服器實例。

Analysis Services 會使用 COM 介面與外掛程式演算法通訊。 若要深入了解如何實作新的演算法,請參閱 外掛程式演算法

您必須先註冊每一個新的演算法,然後才能使用。 若要註冊演算法,請在 SQL Server Analysis Services 實例的 .ini 檔案中新增演算法的必要中繼資料。 您必須在您打算使用新演算法的每一個執行個體中加入該資訊。 在您加入演算法之後,您可以重新啟動執行個體,然後使用 MINING_SERVICES 結構描述資料列集來檢視新的演算法,包括演算法所支援的選項和提供者。

另請參閱

處理多維度模型 (Analysis Services)
資料採礦延伸模組 (DMX) 參考