共用方式為


波氏迴歸

本文說明 Azure 機器學習 設計工具中的元件。

使用此元件在管線中建立Poisson回歸模型。 Poisson 回歸適用於預測數值,通常是計數。 因此,只有當您嘗試預測的值符合下列條件時,才應該使用此元件來建立回歸模型:

  • 響應變數具有 Poisson 分佈

  • 計數不可以是負數。 如果您嘗試將方法與負標籤搭配使用,方法將會完全失敗。

  • 波氏分佈是離散分佈;因此,將此方法與非整數搭配使用並不有意義。

提示

如果您的目標不是計數,Poisson 回歸可能不是適當的方法。 嘗試 設計工具中的其他回歸元件。

設定回歸方法之後,您必須使用包含所要預測值的範例數據集來定型模型。 然後,定型的模型可以用來進行預測。

深入瞭解 Poisson 回歸

Poisson 回歸是一種特殊的回歸分析類型,通常用於模型計數。 例如,Poisson 回歸在這些案例中很有用:

  • 模型化與飛機航班相關聯的感冒數目

  • 估計事件期間的緊急服務通話數目

  • 預測促銷后的客戶查詢數目

  • 建立應變表

由於響應變數具有 Poisson 分佈,因此模型會針對數據及其機率分佈做出不同的假設,例如,最小平方回歸。 因此,Poisson 模型應該與其他回歸模型以不同的方式解譯。

如何設定Poisson回歸

  1. Poisson 回歸 元件新增至設計工具中的管線。 您可以在 [回歸] 類別的 [機器學習 演演算法] 下找到此元件。

  2. 新增數據集,其中包含正確類型的定型數據。

    建議您先使用 Normalize Data 將輸入數據集正規化,再使用它來定型回歸輸入變數。

  3. 在 Poisson 回歸元件的右窗格中,藉由設定 [建立定型定型器模式] 選項,指定您要如何定型模型。

    • 單一參數:如果您知道如何設定模型,請提供一組特定的值作為自變數。

    • 參數範圍:如果您不確定最佳參數,請使用 微調模型超參數位 件執行參數掃掠。 定型器會逐一查看您指定的多個值,以尋找最佳設定。

  4. 優化容錯:輸入定義優化期間容錯間隔的值。 值越低,越慢且更精確。

  5. L1 正規化權數和 L2 正規化權:用於 L1 和 L2 正規化的類型值。 正規化 會將條件約束新增至演算法,以取得與定型數據無關之模型的各個層面。 正規化通常用來避免過度學習。

    • 如果目標是讓模型盡可能疏鬆,L1 正規化就很有用。

      L1 正規化是藉由從學習者嘗試最小化的損失表達式減去加權向量的 L1 權數來完成。 L1 常態是 L0 常態的良好近似值,這是非零座標的數目。

    • L2 正規化可防止加權向量中的任何單一座標在大小上增加太多。 如果目標是要有小型整體權數的模型,L2 正規化就很有用。

    在此元件中,您可以套用 L1 和 L2 正規化的組合。 藉由結合 L1 和 L2 正規化,您可以對參數值的大小施加懲罰。 學習者會嘗試將懲罰降到最低,以將損失降至最低。

    如需 L1 和 L2 正規化的良好討論,請參閱 L1 和 L2 正規化以取得 機器學習

  6. L-BFGS 的記憶體大小:指定要為模型調整和優化保留的記憶體數量。

    L-BFGS 是以 Broyden-Fletcher–Goldfarb–Shanno (BFGS) 演算法為基礎的特定優化方法。 方法會使用有限的內存量 (L) 來計算下一個步驟的方向。

    藉由變更此參數,您可以影響下一個步驟計算所儲存的過去位置和漸層數目。

  7. 將定型資料集和未定型的模型連接到其中一個定型元件:

    • 如果您將 [建立定型器模式] 設定[單一參數],請使用 [定型模型] 元件。

    • 如果您將 [建立定型器模式] 設定[參數範圍],請使用 [微調模型超參數] 元件。

    警告

    • 如果您將參數範圍傳遞至 定型模型,它只會使用參數範圍清單中的第一個值。

    • 如果您將單一參數值集合傳遞至 微調模型超參數位 件,當它預期每個參數的設定範圍時,它會忽略這些值,並使用學習者的預設值。

    • 如果您選取 [ 參數範圍 ] 選項,並針對任何參數輸入單一值,即使您的其他參數在值範圍中變更,您指定的單一值也會在整個掃掠中使用。

  8. 提交管線。

結果

完成定型之後:

  • 若要儲存已定型模型的快照集,請選取定型元件,然後在右側面板中切換至 [輸出+記錄 ] 索引標籤。 按兩下 [註冊數據集] 圖示。 您可以在元件樹狀結構中找到已儲存的模型作為元件。

下一步

請參閱 Azure 機器學習 可用的元件集。