二元平均感知器元件

本文描述 Azure Machine Learning 設計工具中的一個元件。

您可以使用此元件來建立以平均感知器演算法為基礎的機器學習模型。

此分類演算法是受監督的學習方法,並需要包含標籤資料行的已標記的資料集。 您可以透過提供模型和加上標記的資料集做為定型模型的輸入來定型該模型。 然後便可以使用定型的模型來預測新輸入範例的值。

關於平均感知器模型

平均感知器方法是類神經網路的早期和簡易版本。 此方法會根據線性函式,並結合一組衍生自特徵向量的權數,將輸入分類成幾個可能的輸出,因此才稱為「感知」。

較簡單的認知模型適合以線性方式學習可區分的模式,而類神經網路 (尤其是深度神經網路) 可以模型化更複雜的級別界限。 不過,感知器較快速,因為它們會循序處理案例,適用於連續定型。

如何設定二元平均感知器

  1. 二元平均感知器元件新增至管線。

  2. 設定 [建立定型模式] 選項來指定要如何定型模型。

    • 單一參數:如果您知道要如何設定模型,請提供一組特定值做為引數。

    • 參數範圍:如果您不確定最佳參數,且想要執行參數掃掠,請選取此選項。 選取要反覆運算的值範圍,而調整模型超參數會反覆運算您提供的所有可能設定的組合,以判斷可產生最佳結果的超參數。

  3. 針對學習速率,請指定學習速率的值。 學習速率值會控制在每次測試和更正模型時,隨機梯度下降所使用的階梯大小。

    藉由減少速率,模型將會較頻繁地測試,但有可能因此卡在高原期。 如果階梯較大,聚合速度會較快,但會有超過實際最小值的風險。

  4. 針對反覆運算次數上限,請輸入您希望演算法檢查訓練資料的次數。

    早期停止常可帶來較佳的一般化。 增加反覆運算次數目可以改善配適性,但有可能過度配適。

  5. 針對亂數散播,可選擇性輸入要做為種子的整數值。 如果您想要確保跨執行的管線可複製性,建議使用種子。

  6. 連線訓練資料集,並訓練模型:

    • 如果您將 [建立定型模式] 設定為 [單一參數],請連接已標記的資料集和定型模型元件。

    • 如果您將 [建立定型模式] 設定為 [參數範圍],請連接已標記的資料集,並使用調整模型超參數來定型模型。

    注意

    如果您將參數範圍傳遞給定型模型,則系統只會使用單一參數清單中的預設值。

    如果您將單一組參數值傳遞至調整模型超參數元件,當其預期每個參數有一組設定時,則會忽略這些值,並對學習模組使用預設值。

    如果您選取 [參數範圍] 選項,並對任何參數輸入單一值,則在整個掃掠期間都會使用您所指定的該單一值,即使其他參數在某個範圍的值之間變更亦然。

後續步驟

請參閱 Azure Machine Learning 可用的元件集