fastTrees: fastTrees

建立包含可使用 rxEnsemble 將「快速樹狀結構」模型定型之函式名稱與引數的清單。

使用方式

  fastTrees(numTrees = 100, numLeaves = 20, learningRate = 0.2,
    minSplit = 10, exampleFraction = 0.7, featureFraction = 1,
    splitFraction = 1, numBins = 255, firstUsePenalty = 0,
    gainConfLevel = 0, unbalancedSets = FALSE, trainThreads = 8,
    randomSeed = NULL, ...)
 

引數

numTrees

指定要在集團中建立的決策樹總數。 藉由建立多個決策樹,您或許能夠有較佳的涵蓋範圍,但是定型時間會拉長。 預設值是 100。

numLeaves

可在任何樹狀結構中建立的分葉 (終端節點) 數目上限。 較大的值可能會增加樹狀結構的大小並提高精確度,但有可能會過度學習,且需要較長的定型時間。 預設值為 20。

learningRate

決定學習過程的每個步驟中,以梯度方向採取的步驟大小。 這將決定學習模組收斂到最佳解決方案的快慢。 如果步驟太大,您可能會超過最佳解決方案。 如果步長太小,定型需花較久時間收斂到最佳解決方案。

minSplit

形成分葉所需的定型執行個體數下限。 也就是說,從子取樣資料中,迴歸樹的分葉中允許的文件數目下限。 「分割」意指樹狀結構的每個層級 (節點) 中的特徵是隨機分割的。 預設值是 10。 雖然會對執行個體進行加權,不過只會計算執行個體數。

exampleFraction

要用於每個樹狀結構的隨機選擇執行個體比例。 預設值為 0.7。

featureFraction

要用於每個樹狀結構的隨機選擇功能分數。 預設值為 1。

splitFraction

要用於每個分割的隨機選擇功能分數。 預設值為 1。

numBins

每個特徵的相異值 (間隔) 數上限。 如果特徵的值少於指定數目,則每個值都會放在本身的間隔中。 如果有更多值,演算法會建立 numBins 間隔。

firstUsePenalty

特徵會先使用懲罰係數。 這是一種正規化形式,會在建立樹狀結構時因使用新特徵而招致懲罰。 增加此值來建立不使用許多特徵的樹狀結構。 預設值為 0。

gainConfLevel

樹狀結構調整增益的信賴需求 (應在範圍 [0,1] 內)。 預設值為 0。

unbalancedSets

如果為 TRUE,則會使用針對未平衡集合最佳化的衍生項目。 只有在 type 等於 "binary" 時適用。 預設值是 FALSE

trainThreads

要用於定型的執行緒數目。 預設值為 8。

randomSeed

指定隨機種子。 預設值是 NULL

...

其他引數。