邏輯架構 (Analysis Services – 資料採礦)
資料採礦是涉及多個元件互動的程序。您可以存取 SQL Server 資料庫或任何其他資料來源中的資料來源,以供定型、測試或預測用途。Business Intelligence Development Studio 或 Visual Studio 2005 可用來定義資料採礦結構和模型,SQL Server Management Studio 則可用來管理資料採礦物件及建立預測及查詢。當此方案完成時,可將其部署到 Analysis Services 的執行個體。
資料採礦方案和專案
若要建立資料採礦方案,您必須定義資料來源、資料採礦結構和資料採礦模型。您建立的資料採礦專案也可以包含用來驗證模型的測試集。將專案部署到伺服器之後,可以繼續在原始方案中開發及測試新模型。
資料採礦來源資料
您不需要使用 Cube 或其他特定的資料來源,也可以執行資料採礦。在關聯式資料表或在任何定義為 Analysis Services 資料來源檢視的其他資料來源上,都可以快速而輕鬆地進行資料採礦。資料採礦方案中不會儲存用於資料採礦的資料,而只會儲存繫結。資料可能位於以舊版的 SQL Server 所建立的資料庫、CRM 系統或甚至一般檔案中。透過 Analysis Services 資料來源檢視,您可以藉由在多個資料表之間指定聯結而結合多個資料來源。您也可以加入具有多對一關聯性的資料表,以建立巢狀資料表資料行。
當您需要在資料採礦方案中使用資料時,Analysis Services 會從來源讀取資料,並產生所使用的彙總與其他資訊的快取。您可以保存快取的資訊,並用其建立新的資料採礦模型,或者也可將其刪除,以節省儲存空間。
您可以持續使用新資料來更新資料採礦方案,或者,如果您發現模型運算良好,也可以依現狀部署該模型,而永遠不在模型中加入新資料。
SQL Server 2008 Analysis Services 也提供將資料分割為訓練資料集與測試資料集的功能,讓您可以在隨機選取但具代表性的資料集上測試採礦模型。
如需有關建立及使用 Analysis Services 資料來源和資料來源檢視的詳細資訊,請參閱<定義資料來源 (Analysis Services)>。
資料採礦結構
「資料採礦結構」(Data Mining Structure) 是定義資料網域 (從中建立採礦模型) 的邏輯資料結構。單一採礦結構可支援共用相同網域的多個採礦模型。資料採礦結構可資料分割成定型集與測試集,方法是將資料的百分比或量指定為 HOLDOUT。這個資料分割作業可在您定義資料採礦結構時自動完成
如需詳細資訊,請參閱<採礦結構 (Analysis Services - 資料採礦)>。
資料採礦結構可以包含巢狀資料表。巢狀資料表會提供有關主要資料表中建立模型之案例的詳細資料。如需詳細資訊,請參閱<巢狀資料表 (Analysis Services - 資料採礦)>。
資料採礦模型
「資料採礦模型」(Data Mining Model) 代表資料、資料採礦演算法和參數及篩選設定集合的組合,會對使用的資料以及資料的處理方法造成影響。如需詳細資訊,請參閱<採礦模型 (Analysis Services - 資料採礦)>。
您可以使用資料採礦延伸模組 (DMX) 語言或 BI Development Studio 中的資料採礦精靈,定義資料採礦模型。如需有關如何使用資料採礦精靈的詳細資訊,請參閱<資料採礦精靈 (Analysis Services - 資料採礦)>。如需有關如何使用 DMX 的詳細資訊,請參閱<資料採礦延伸模組 (DMX) 參考>。
定義採礦模型的結構之後,您要處理它,並以描述此模型的模式來擴展空白結構。這就是所謂的培訓模型。您可以藉由將原始資料通過數學演算法來尋找模式,也可以使用參數來調整每一個演算法。如需有關選取資料採礦演算法的詳細資訊,請參閱<資料採礦演算法 (Analysis Services - 資料採礦)>。如需有關如何在個別的資料採礦演算法上設定參數以微調模型結果的詳細資訊,請參閱<自訂資料採礦模型 (Analysis Services - 資料採礦)>。
在建立新的資料採礦模型時,可以進行預測來加以反覆測試,然後再進行變更以改良結果。這些變更可能包含加入更多資料,或者變更模型的參數以更符合資料。如需有關測試預測精確度的詳細資訊,請參閱<驗證資料採礦模型 (Analysis Services - 資料採礦)>。
部署
資料採礦開發的最終目標,是建立出能讓使用者及分析師用來進行預測和執行深入分析的模型。因此,當您滿足於模型所產生的結果時,就可以將該模型部署到實際執行環境。採礦模型可以在實際執行環境中提供多種用途,視您的需要而定。下列清單提供可以使用資料採礦模型所執行工作的範例:
使用模型來建立預測,然後做出商務決策。SQL Server 會提供您可用來建立預測查詢的 DMX 語言,並會提供預測查詢產生器來協助您建立查詢。
直接將資料採礦功能內嵌於應用程式中。您可以包括分析管理物件 (AMO) 或含有一組物件的組件,讓應用程式用來建立、改變、處理以及刪除採礦結構和採礦模型。另外,您可以將 XML for Analysis (XMLA) 訊息直接傳送到 Analysis Services 的執行個體。
使用 Integration Services 來建立封裝,其中會使用採礦模型,有智慧地將內送資料分成多個資料表。例如,若資料庫因為潛在客戶而不斷更新,您可以同時使用採礦模型與 Integration Services,將內送資料分成可能購買產品的客戶和可能不購買產品的客戶。
建立可讓使用者直接查詢現有之採礦模型的報表。使用者可能想要建立不同的預測,或者分析師可能想要直接存取採礦模型內容,所以他們可以瀏覽資料中的有趣模式。
更新模型是部署策略的一部份。由於進入組織的資料越來越多,您必須重新處理模型,來改進其效能。如需詳細資訊,請參閱<部署 (Analysis Services - 資料採礦)>和<建立 DMX 預測查詢>。