分享方式:


fastLinear:fastLinear

建立包含可使用 rxEnsemble 將「快速線性」模型定型之函式名稱與引數的清單。

使用方式

  fastLinear(lossFunction = NULL, l2Weight = NULL, l1Weight = NULL,
    trainThreads = NULL, convergenceTolerance = 0.1, maxIterations = NULL,
    shuffle = TRUE, checkFrequency = NULL, ...)
 

引數

lossFunction

指定最佳化的經驗損失函數。 針對二元分類,下列選項可供使用:

  • logLoss:記錄遺失。 此為預設值。
  • hingeLoss:SVM 轉軸遺失。 其參數代表邊界大小。
  • smoothHingeLoss:平滑轉軸遺失。 其參數代表平滑常數。
    針對線性迴歸,目前支援平方損失 squaredLoss。 當此參數設定為 NULL 時,其預設值取決於學習類型:
  • 二元分類的 logLoss
  • 線性迴歸的 squaredLoss

l2Weight

指定 L2 正規化權數。 此值必須是非負數或 NULL。 如果指定 NULL,則會根據資料集自動計算實際值。 NULL 為預設值。

l1Weight

指定 L1 正規化權數。 此值必須是非負數或 NULL。 如果指定 NULL,則會根據資料集自動計算實際值。 NULL 為預設值。

trainThreads

指定可以使用多少個並行執行緒來執行演算法。 當此參數設定為 NULL 時,使用的執行緒數目取決於可用於程序上的邏輯處理器數目以及資料稀疏性。 將其設定為 1,以在單一執行緒中執行演算法。

convergenceTolerance

指定作為聚合準則的容錯閾值。 該值必須介於 0 和 1 之間。 預設值是 0.1。 如果相對對偶間隙 (對偶間隙與主要損失之間的比率) 低於指定的聚合容錯,則演算法會被視為已聚合。

maxIterations

指定訓練反覆運算次數的上限。 此參數必須是正數或 NULL。 如果指定 NULL,則會根據資料集自動計算實際值。 每次反覆運算都需要完整傳遞訓練資料。 訓練會在反覆運算總次數達到指定上限之後或在損失函數聚合時 (先發生者) 終止。

shuffle

指定是否要隨機顯示訓練資料。 設定為 TRUE 表示隨機顯示資料,設定為 FALSE 表示不隨機顯示。 預設值是 TRUE。 SDCA 是隨機最佳化演算法。 如果開啟隨機顯示,則會在每次反覆運算時隨機顯示訓練資料。

checkFrequency

計算並檢查損失函數以判斷其是否聚合的反覆運算次數。 指定的值必須是正整數或 NULL。 如果為 NULL,則會根據資料集自動計算實際值。 否則,舉例來說,若指定 checkFrequency = 5,則每 5 次反覆運算就會計算損失函數並檢查聚合。 損失函數的計算需要單獨完整傳遞訓練資料。

...

其他引數。