波氏迴歸

發行項
09/01/2024

本文說明 Azure 機器學習設計工具中的元件。

使用此元件在管線中建立Poisson回歸模型。 Poisson 回歸適用於預測數值，通常是計數。因此，只有當您嘗試預測的值符合下列條件時，才應該使用此元件來建立回歸模型：

響應變數具有 Poisson 分佈。
計數不可以是負數。如果您嘗試將方法與負標籤搭配使用，方法將會完全失敗。
波氏分佈是離散分佈;因此，將此方法與非整數搭配使用並不有意義。

提示

如果您的目標不是計數，Poisson 回歸可能不是適當的方法。嘗試設計工具中的其他回歸元件。

設定回歸方法之後，您必須使用包含所要預測值的範例數據集來定型模型。然後，定型的模型可以用來進行預測。

深入瞭解 Poisson 回歸

Poisson 回歸是一種特殊的回歸分析類型，通常用於模型計數。例如，Poisson 回歸在這些案例中很有用：

模型化與飛機航班相關聯的感冒數目
估計事件期間的緊急服務通話數目
預測促銷后的客戶查詢數目
建立應變表

由於響應變數具有 Poisson 分佈，因此模型會針對數據及其機率分佈做出不同的假設，例如，最小平方回歸。因此，Poisson 模型應該與其他回歸模型以不同的方式解譯。

如何設定Poisson回歸

將 Poisson 回歸 元件新增至設計工具中的管線。您可以在 [回歸] 類別的 [機器學習演演算法] 下找到此元件。
新增數據集，其中包含正確類型的定型數據。

建議您先使用 Normalize Data 將輸入數據集正規化，再使用它來定型回歸輸入變數。
在 Poisson 回歸元件的右窗格中，藉由設定 [建立定型定型器模式] 選項，指定您要如何定型模型。
- 單一參數：如果您知道如何設定模型，請提供一組特定的值作為自變數。
- 參數範圍：如果您不確定最佳參數，請使用微調模型超參數位件執行參數掃掠。定型器會逐一查看您指定的多個值，以尋找最佳設定。
優化容錯：輸入定義優化期間容錯間隔的值。值越低，越慢且更精確。
L1 正規化權數和 L2 正規化權數：用於 L1 和 L2 正規化的類型值。 正規化 會將條件約束新增至演算法，以取得與定型數據無關之模型的各個層面。正規化通常用來避免過度學習。
- 如果目標是讓模型盡可能疏鬆，L1 正規化就很有用。
  
  L1 正規化是藉由從學習者嘗試最小化的損失表達式減去加權向量的 L1 權數來完成。 L1 常態是 L0 常態的良好近似值，這是非零座標的數目。
- L2 正規化可防止加權向量中的任何單一座標在大小上增加太多。如果目標是要有小型整體權數的模型，L2 正規化就很有用。
在此元件中，您可以套用 L1 和 L2 正規化的組合。藉由結合 L1 和 L2 正規化，您可以對參數值的大小施加懲罰。學習者會嘗試將懲罰降到最低，以將損失降至最低。

如需 L1 和 L2 正規化的良好討論，請參閱 L1 和 L2 正規化以取得機器學習。
L-BFGS 的記憶體大小：指定要為模型調整和優化保留的記憶體數量。

L-BFGS 是以 Broyden-Fletcher–Goldfarb–Shanno （BFGS）演算法為基礎的特定優化方法。方法會使用有限的內存量（L）來計算下一個步驟的方向。

藉由變更此參數，您可以影響下一個步驟計算所儲存的過去位置和漸層數目。
將定型資料集和未定型的模型連接到其中一個定型元件：
- 如果您將 [建立定型器模式] 設定為 [單一參數]，請使用 [定型模型] 元件。
- 如果您將 [建立定型器模式] 設定為 [參數範圍]，請使用 [微調模型超參數] 元件。
警告
- 如果您將參數範圍傳遞至定型模型，它只會使用參數範圍清單中的第一個值。
- 如果您將單一參數值集合傳遞至微調模型超參數位件，當它預期每個參數的設定範圍時，它會忽略這些值，並使用學習者的預設值。
- 如果您選取 [ 參數範圍 ] 選項，並針對任何參數輸入單一值，即使您的其他參數在值範圍中變更，您指定的單一值也會在整個掃掠中使用。
提交管線。

結果

完成定型之後：

若要儲存已定型模型的快照集，請選取定型元件，然後在右側面板中切換至 [輸出+記錄 ] 索引標籤。按兩下 [註冊數據集] 圖示。您可以在元件樹狀結構中找到已儲存的模型作為元件。

下一步

請參閱 Azure 機器學習可用的元件集。

共用方式為

波氏迴歸

深入瞭解 Poisson 回歸

如何設定Poisson回歸

結果

下一步

意見反應

其他資源