fastTrees: fastTrees

發行項
05/04/2023

建立包含可使用 rxEnsemble 將「快速樹狀結構」模型定型之函式名稱與引數的清單。

使用方式

  fastTrees(numTrees = 100, numLeaves = 20, learningRate = 0.2,
    minSplit = 10, exampleFraction = 0.7, featureFraction = 1,
    splitFraction = 1, numBins = 255, firstUsePenalty = 0,
    gainConfLevel = 0, unbalancedSets = FALSE, trainThreads = 8,
    randomSeed = NULL, ...)

引數

`numTrees`

指定要在集團中建立的決策樹總數。藉由建立多個決策樹，您或許能夠有較佳的涵蓋範圍，但是定型時間會拉長。預設值是 100。

`numLeaves`

可在任何樹狀結構中建立的分葉 (終端節點) 數目上限。較大的值可能會增加樹狀結構的大小並提高精確度，但有可能會過度學習，且需要較長的定型時間。預設值為 20。

`learningRate`

決定學習過程的每個步驟中，以梯度方向採取的步驟大小。這將決定學習模組收斂到最佳解決方案的快慢。如果步驟太大，您可能會超過最佳解決方案。如果步長太小，定型需花較久時間收斂到最佳解決方案。

`minSplit`

形成分葉所需的定型執行個體數下限。也就是說，從子取樣資料中，迴歸樹的分葉中允許的文件數目下限。「分割」意指樹狀結構的每個層級 (節點) 中的特徵是隨機分割的。預設值是 10。雖然會對執行個體進行加權，不過只會計算執行個體數。

`exampleFraction`

要用於每個樹狀結構的隨機選擇執行個體比例。預設值為 0.7。

`featureFraction`

要用於每個樹狀結構的隨機選擇功能分數。預設值為 1。

`splitFraction`

要用於每個分割的隨機選擇功能分數。預設值為 1。

`numBins`

每個特徵的相異值 (間隔) 數上限。如果特徵的值少於指定數目，則每個值都會放在本身的間隔中。如果有更多值，演算法會建立 numBins 間隔。

`firstUsePenalty`

特徵會先使用懲罰係數。這是一種正規化形式，會在建立樹狀結構時因使用新特徵而招致懲罰。增加此值來建立不使用許多特徵的樹狀結構。預設值為 0。

`gainConfLevel`

樹狀結構調整增益的信賴需求 (應在範圍 [0,1] 內)。預設值為 0。

`unbalancedSets`

如果為 TRUE，則會使用針對未平衡集合最佳化的衍生項目。只有在 type 等於 "binary" 時適用。預設值是 FALSE。

`trainThreads`

要用於定型的執行緒數目。預設值為 8。

`randomSeed`

指定隨機種子。預設值是 NULL。

`...`

其他引數。