fastTrees: fastTrees

rxEnsemble で FastTree モデルをトレーニングするための関数名と引数を含むリストを作成します。

使用方法

  fastTrees(numTrees = 100, numLeaves = 20, learningRate = 0.2,
    minSplit = 10, exampleFraction = 0.7, featureFraction = 1,
    splitFraction = 1, numBins = 255, firstUsePenalty = 0,
    gainConfLevel = 0, unbalancedSets = FALSE, trainThreads = 8,
    randomSeed = NULL, ...)

引数

`numTrees`

アンサンブルに作成するデシジョンツリーの総数を指定します。作成するデシジョンツリーを増やすと、カバレッジが向上する可能性はありますが、トレーニング時間が長くなります。既定値は 100 です。

`numLeaves`

ツリーに作成できるリーフ (終端ノード) の最大数。値を大きくすると、ツリーのサイズが大きくなって精度が向上する可能性がありますが、オーバーフィットが発生し、トレーニング時間が長くなるリスクがあります。既定値は 20 です。

`learningRate`

学習プロセスの各ステップで、勾配の方向に対して実行されるステップのサイズを決定します。これにより、学習器がどの程度の速さ (遅さ) で最適解に収束するかが決まります。ステップサイズが大きすぎると、最適解から離れていってしまう可能性があります。ステップサイズが小さすぎると、トレーニングが最適解に収束するまでの時間が長くなります。

`minSplit`

リーフを形成するために必要なトレーニングインスタンスの最小数。つまり、サブサンプリングされたデータから、回帰ツリーのリーフで許可されるドキュメントの最小数です。 "分割" とは、ツリー (ノード) の各レベルの特徴がランダムに分割されることを意味します。既定値は 10 です。インスタンスが重み付けされた場合でも、インスタンスの数だけがカウントされます。

`exampleFraction`

各ツリーに使用するランダムに選択されたインスタンスの割合。既定値は 0.7 です。

`featureFraction`

各ツリーに使用するランダムに選択された特徴の割合。既定値は 1 です。

`splitFraction`

各分割に使用するランダムに選択された特徴の割合。既定値は 1 です。

`numBins`

特徴ごとの個別の値 (ビン) の最大数。特徴の値が指定された数よりも小さい場合、それぞれの値が独自のビンに配置されます。値が多い場合、アルゴリズムによって numBins 個のビンが作成されます。

`firstUsePenalty`

特徴の初回使用ペナルティ係数。これは、ツリーの作成時に新しい特徴を使用するとペナルティが発生する正則化の形式です。この値を大きくすると、多数の特徴を使用しないツリーが作成されます。既定値は 0 です。

`gainConfLevel`

ツリーフィットゲイン信頼度要件 ([0, 1) の範囲内である必要があります)。既定値は 0 です。

`unbalancedSets`

TRUE の場合、不均衡セットに最適化された導関数が使用されます。 type が "binary" に等しい場合にのみ適用されます。既定値は FALSE です。

`trainThreads`

トレーニングで使用するスレッドの数。既定値は 8 です。

`randomSeed`

ランダムシードを指定します。既定値は NULL です。

`...`

追加の引数。

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-01-02

次の方法で共有

fastTrees: fastTrees

使用方法

引数

numTrees

numLeaves

learningRate

minSplit

exampleFraction

featureFraction

splitFraction

numBins

firstUsePenalty

gainConfLevel

unbalancedSets

trainThreads

randomSeed

...