分享方式:


雙類別支援向量機器元件

本文說明 Azure 機器學習 設計工具中的元件。

使用此元件來建立以支援向量機器演算法為基礎的模型。

支援向量機器(SVM)是一種經過精心研究的監督學習方法類別。 此特定實作適合根據連續或類別變數來預測兩個可能的結果。

定義模型參數之後,請使用定型元件來定型模型,並提供 包含標籤或結果數據行的標記數據集

關於支援向量機器

支援向量機器是最早的機器學習演算法之一,許多應用程式中都已使用 SVM 模型,從資訊擷取到文字和影像分類。 SVM 可用於分類和回歸工作。

此 SVM 模型是需要加上標籤數據的監督式學習模型。 在定型程式中,演算法會分析輸入數據,並在稱為 超平面的多維度特徵空間中辨識模式。 所有輸入範例都會以這個空間中的點表示,並對應至輸出類別,讓類別以盡可能寬和清除間距的方式進行對應。

為了進行預測,SVM 演算法會將新的範例指派給一個類別或其他類別,將它們對應到相同的空間。

如何設定

針對此模型類型,建議您先將數據集正規化,再使用它來定型分類器。

  1. 雙類別支援向量機器 元件新增至管線。

  2. 藉由設定 [建立定型定型器模式 ] 選項,指定您要如何定型模型。

    • 單一參數:如果您知道如何設定模型,您可以提供一組特定的值做為自變數。

    • 參數範圍:如果您不確定最佳參數,您可以使用微調模型超參數位件來尋找最佳參數。 您提供一些值範圍,而定型器會逐一查看設定的多個組合,以判斷產生最佳結果的值組合。

  3. 針對 反覆項目數目,輸入數位,表示建置模型時所使用的反覆項目數目。

    此參數可用來控制定型速度和精確度之間的取捨。

  4. 針對 Lambda,輸入值以做為 L1 正規化的權數。

    這個正規化係數可用來調整模型。 較大的值會懲罰更複雜的模型。

  5. 如果您想要在定型之前將功能正規化,請選取 [標準化功能] 選項

    如果您套用正規化,在定型之前,數據點會置中於平均值,並調整為有一個標準偏差單位。

  6. 選取 [項目到單位球體] 選項,將係數正規化。

    將值投射到單位空間表示在定型之前,數據點會置中為0,並調整為有一個標準偏差單位。

  7. 在 [隨機數種子] 中,如果您想要確保跨回合的重現性,請輸入要當做種子使用的整數值。 否則,系統會使用系統時鐘值做為種子,這可能會導致整個執行的結果稍有不同。

  8. 連接標示的數據集,並定型模型:

    注意

    如果您將參數範圍傳遞至 定型模型,它只會使用單一參數清單中的預設值。

    如果您將單一參數值集合傳遞至 微調模型超參數位 件,當它預期每個參數的設定範圍時,它會忽略這些值,並使用學習者的預設值。

    如果您選取 [ 參數範圍 ] 選項,並針對任何參數輸入單一值,即使您的其他參數在值範圍中變更,您指定的單一值也會在整個掃掠中使用。

  9. 提交管線。

結果

完成定型之後:

  • 若要儲存已定型模型的快照集,請選取 [定型模型] 元件右面板中的 [輸出] 索引標籤。 選取 [ 註冊數據集] 圖示,將模型儲存為可重複使用的元件。

  • 若要使用模型進行評分,請將 評分模型 元件新增至管線。

下一步

請參閱 Azure 機器學習 可用的元件集。