建立包含函式名稱和自變數的清單,以使用 rxEnsemble 定型 FastForest 模型。
用法
fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
trainThreads = 8, randomSeed = NULL, ...)
論點
numTrees
指定要在合奏中建立的判定樹總數。 藉由建立更多判定樹,您可能會獲得更好的涵蓋範圍,但定型時間會增加。 預設值是 100。
numLeaves
可在任何樹狀結構中建立的葉數上限(終端節點)。 較高的值可能會增加樹狀結構的大小,並取得較佳的精確度,但風險過度學習,而且需要較長的定型時間。 預設值為 20。
minSplit
形成分葉所需的定型實例數目下限。 也就是說,回歸樹狀結構分葉允許的最小檔數目,超出子取樣的數據。 「分割」表示樹狀結構(節點)每個層級的功能都會隨機分割。 預設值為 10。
exampleFraction
要用於每個樹狀結構的隨機選擇實例的分數。 預設值為 0.7。
featureFraction
要用於每個樹狀結構的隨機選擇特徵分數。 預設值為 0.7。
splitFraction
要在每個分割上使用之隨機選擇特徵的分數。 預設值為 0.7。
numBins
每個功能相異值 (bins) 的最大數目。 預設值為 255。
firstUsePenalty
特徵會先使用懲罰係數。 預設值為 0。
gainConfLevel
樹形調整獲得信賴需求(應介於 [0,1) 範圍內)。 預設值為 0。
trainThreads
定型中使用的線程數目。 如果 NULL 已指定,則會在內部決定要使用的線程數目。 預設值是 NULL。
randomSeed
指定隨機種子。 預設值是 NULL。
...
其他自變數。