共用方式為


分類精靈 (適用於 Excel 的資料探勘外掛程式)

資料採礦功能區中的分類精靈

[分類精靈] 可協助您根據 Excel 數據表、Excel 範圍或外部數據源中的現有數據來建置分類模型。

分類模型會擷取數據中的模式,指出相似性,並協助您根據值的群組進行預測。 例如,分類模型可用來根據收入或支出模式預測風險。

使用分類精靈

  1. [數據採礦] 功能區中,按兩下 [ 分類],然後按 [ 下一步]。

  2. 在 [ 選取源數據] 頁面中,選擇要分析的數據。

    此精靈支持多種數據:Excel 數據表、Excel 範圍和外部數據源。 透過外部數據,您可以將它加入 Excel,或在 Analysis Services 數據源中選擇一組數據表或檢視表。 您也可以新增數據表和變更數據行,以建立臨機作數據源。

  3. 在 [ 分類 ] 頁面上,選擇您要分類的數據行。

    檢閱清單中的欄位、輸入欄位,並取消選取任何具有唯一值的欄位,因為這些欄位不利於建立模式,例如ID號碼、客戶名稱等等。 您也應該移除那些實質上與可分類數據行重複的數據行。

    例如,如果您要分類預測產品的類別,則如果有已知的商務規則,則應該排除子類別欄位,否則該規則的強度可能會讓您無法探索其他相互關聯。

  4. 或者,按兩下 [ 參數 ] 來變更演算法參數,並自定義叢集模型的行為。

  5. 在 [ 將數據分割成定型和測試集 ] 頁面中,指定要保留多少數據進行測試。 其餘部分一律用於定型模型。

    默認設定為 30% 測試數據和 70% 訓練數據。

  6. 在 [ 完成 ] 頁面上,提供數據集和模型的描述性名稱,並設定下列選項來控制如何使用完成的模型:

    • 流覽模型。 選取此選項時,只要精靈完成模型處理,就會開啟 [ 流覽 ] 視窗,以協助您探索結果。 查看器的內容取決於您建立的模型類型。 如需詳細資訊,請參閱 流覽判定樹模型瀏覽類神經網路模型

    • 啟用鑽取。 選取此選項可檢視已完成模型的基礎數據。 只有在您建置判定樹模型時,才能使用此選項。

    • 使用暫存模型。 如果您選取此選項,模型將不會儲存至伺服器。 當您關閉 Excel 時,會刪除暫存模型。

進一步了解分類模型

在 [ 演算法參數 ] 對話框中,您也可以從 Analysis Services 中提供的這些演算法中選擇分類方法:

  • Microsoft判定樹

  • Microsoft邏輯迴歸

  • Microsoft Naïve Bayes

  • Microsoft類神經網路

雖然演算法可能會產生類似的結果,但它們會以不同的方式分析數據,因此我們建議嘗試數個演算法並比較結果。 默認方法是Microsoft判定樹。

在 [ 參數 ] 列表中,您可以變更進階選項,這取決於您選擇的演算法類型。 每個演算法的參數會在《SQL Server 在線叢書》中詳細說明。

Microsoft判定樹演算法技術參考

Microsoft羅吉斯回歸演算法技術參考

Microsoft 樸素貝葉斯演算法技術參考

Microsoft類神經網路演算法技術參考

需求

若要使用 分類 精靈,您必須連線到 Analysis Services 資料庫。 如需如何建立連線的資訊,請參閱連線至源數據(適用於 Excel 的數據採礦用戶端)。

另請參閱

建立數據採礦模型