雙類別支援向量機器元件

本文描述 Azure Machine Learning 設計工具中的一個元件。

使用此元件來建立以支援向量機器演算法為基礎的模型。

支援向量機器 (SVM) 是一類經過充分研究的監督式學習方法。 此特定實作適合以連續或分類變數為基礎,預測兩個可能的結果。

定義模型參數之後,請使用定型元件,並提供包含標籤或結果資料行的「標記資料集」,以定型模型。

關於支援向量機器

支援向量機器是其中一個最早的機器學習演算法,而且在許多應用程式 (從資訊擷取到文字和影像分類) 中,都已使用 SVM 模型。 SVM 可用於分類和迴歸工作。

此 SVM 模型是一種需要標記資料的監督式學習模型。 在定型過程中,演算法會分析輸入資料,並辨識多維度特徵空間 (稱為「超平面」) 中的模式。 所有輸入範例在此空間中以點表示,並對應到輸出類別,而盡可能以越寬和越清晰的間隙分割類別。

在預測時,SVM 演算法將新的範例指派給其中一個類別,並對應到相同的空間。

如何設定

對於此模型類型,建議您先將資料集正規化,再用來定型分類器。

  1. 雙類別支援向量機器元件新增至管線。

  2. 設定 [建立定型模式] 選項來指定要如何定型模型。

    • 單一參數:如果您知道要如何設定模型,您可以提供一組特定值做為引數。

    • 參數範圍:如果不確定最佳參數,您可以使用調整模型超參數元件來尋找最佳參數。 您提供某個範圍的值,定型模組會逐一查看多個設定組合,以決定可產生最佳結果的值組合。

  3. 在 [反覆運算次數] 中輸入數字,代表建立模型時使用的反覆運算次數。

    這個參數可以用來控制定型速度和精確性之間的取捨。

  4. 在 [Lambda] 中輸入值,做為 L1 正規化的權數。

    這個正則化係數可用來調整模型。 值越大,模型就越複雜。

  5. 如果要在定型之前將特徵正規化,請選取 [正規化特徵] 選項。

    如果您套用正規化,則在定型之前,資料點會集中在平均值,並調整為具有一個單位的標準差。

  6. 選取 [投影到單位球面] 選項來正規化係數。

    將值投影到單位空間表示在定型之前,資料點會集中在 0,並調整為具有一個單位的標準差。

  7. 如果您要確保跨執行的重現性,請在 [亂數種子] 中輸入整數值做為種子。 否則會以系統時鐘值為種子,這可能導致每次執行的結果稍微不同。

  8. 連線標記資料集,並定型模型:

    • 如果您將 [建立定型模式] 設定為 [單一參數],請連接已標記的資料集和定型模型元件。

    • 如果您將 [建立定型模式] 設定為 [參數範圍],請連接已標記的資料集,並使用調整模型超參數來定型模型。

    注意

    如果您將參數範圍傳遞給定型模型,則系統只會使用單一參數清單中的預設值。

    如果您將單一組參數值傳遞至調整模型超參數元件,當其預期每個參數有一組設定時,則會忽略這些值,並對學習模組使用預設值。

    如果您選取 [參數範圍] 選項,並對任何參數輸入單一值,則在整個掃掠期間都會使用您所指定的該單一值,即使其他參數在某個範圍的值之間變更亦然。

  9. 提交管線。

結果

定型完成後:

  • 若要儲存已定型模型的快照集,請在定型模型元件的右側面板中選取 [輸出] 索引標籤。 選取 [註冊資料集] 圖示,將模型儲存為可重複使用的元件。

  • 若要使用模型來評分,請將評分模型元件新增至管線。

後續步驟

請參閱 Azure Machine Learning 可用的元件集