機器學習-定型

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。建議您在該日期之前轉換成 Azure Machine Learning。

自 2021 年 12 月 1 日起，您將無法建立新的 Machine Learning 工作室 (傳統) 資源。在 2024 年 8 月 31 日之前，您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

請參閱將機器學習專案從 ML 工作室 (傳統) 移至 Azure Machine Learning 的相關資訊。
深入瞭解Azure Machine Learning。

ML 工作室 (傳統) 文件即將淘汰，未來將不再更新。

本文說明機器學習 Studio (傳統) 中提供的模組，用來定型機器學習模型。定型是使用預先定義之模型的參數來分析輸入資料的流程。從這個分析中，模型會學習模式，並以定型模型的形式儲存它們。

注意

適用于：僅限機器學習 Studio (傳統)

Azure Machine Learning 設計工具中提供類似的拖放模組。

本文也說明機器學習 Studio (傳統) 建立模型、訓練、評估和評分的整體流程。

建立和使用機器學習模型

機器學習服務的一般工作流程包括下列階段：

選擇適當的演算法，並設定初始選項。
針對相容的資料定型模型。
根據模型中的模式，使用新的資料建立預測。
評估模型以判斷預測是否正確、有多少錯誤，以及是否有任何過度學習。

機器學習 Studio (傳統) 支援適用于機器學習的彈性、可自訂架構。此程式中的每個工作都是由特定類型的模組所執行，這些類型可以修改、新增或移除，而不會中斷實驗的其餘部分。

此類別中的模組支援不同模型類型的定型。在定型期間，資料會由機器學習演算法進行分析。此演算法會分析資料的分佈和類型、編譯統計資料，並建立稍後可用於預測的模式。

深入瞭解模型定型

當機器學習正在定型模型時，就會略過具有遺漏值的資料列。因此，如果您想要手動修正這些值、使用插補或指定不同的方法來處理遺漏值，請先使用「清除遺漏的資料」模組，再對資料集進行定型。

建議您使用 [ 編輯中繼資料 ] 模組來修正資料的任何其他問題。您可能需要標記標籤資料行、變更資料類型或正確的資料行名稱。

針對其他常見的資料清除工作，例如正規化、取樣、分類收納和調整，請參閱資料轉換分類。

選擇適當的訓練員

您用來定型模型的方法，取決於您所建立的模型類型，以及模型所需的資料類型。例如，機器學習提供專門用來定型異常偵測模型、建議模型等的模組。

檢查定型模組的清單，以判斷哪一個對您的案例而言是正確的。

如果您不確定在定型模型時所使用的最佳參數，請使用提供的其中一個模組來進行參數清除和驗證：

微調模型超參數可以在幾乎所有的分類和回歸模型上執行參數清理。它會訓練多個模型，然後傳回最佳的模型。
在定型過程中，「整理叢集」模組支援模型調整，且僅適用于群集模型。您可以指定距心範圍，並在自動偵測最佳參數時對資料進行定型。
交叉驗證模型模組也適用于模型優化，但不會傳回定型的模型。相反地，它會提供您可用來決定最佳模型的計量。

重新定型模型

如果您需要重新定型生產模型，您可以隨時重新執行實驗。

您也可以使用 web 服務將重新訓練程式自動化。如需逐步解說，請參閱使用 Azure Data Factory 重新定型和更新機器學習模型。

使用預先定型模型

機器學習包含一些預先定型的模型，例如預先定型 Cascade Image 分類模組。您可以使用這些模型進行評分，而不需要額外的資料輸入。

此外，某些模組 (例如時間序列異常偵測) 不會以 .ilearner 格式產生定型的模型。但是，他們會在內部建立定型資料並建立模型，然後用它來進行預測。若要使用這些參數，您只需要設定參數並提供資料。

儲存定型模型的快照集

如果您想要儲存或匯出模型，請以滑鼠右鍵按一下定型模組，然後選取 [ 另存為定型的模型]。模型會匯出為 .Ilearner 格式，並儲存在您的工作區中的 定型模型下。定型的模型可以在其他實驗中重複使用，或連接到其他模組以進行評分。

您也可以使用實驗中的「載入定型模型」模組來抓取預存模型。

模組清單

定型類別包含下列模組：

清理叢集：在叢集模型上執行參數清除，以判斷最佳的參數設定，並訓練最佳的模型。
定型異常偵測模型：定型異常偵測器模型，以及從定型集中標記資料。
定型群集模型：定型群集模型，並將定型集的資料指派給群集。
定型 Matchbox 推薦：使用 Matchbox 演算法訓練貝氏推薦。
定型模型：從定型集定型分類或回歸模型。
微調模型超參數：在回歸或分類模型上執行參數清除，以判斷最佳的參數設定，並訓練最佳的模型。

某些模組不在此類別中，因為它們需要特殊格式或針對特定工作自訂：

另請參閱

Last updated on 2019-05-06