Freigeben über


fastForest: fastForest

Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines FastForest-Modells mit rxEnsemble.

Verwendung

  fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
    exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
    numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
    trainThreads = 8, randomSeed = NULL, ...)
 

Argumente

numTrees

Gibt die Gesamtanzahl von Entscheidungsstrukturen an, die im Ensemble erstellt werden sollen. Mit einer höheren Anzahl von Entscheidungsstrukturen erzielen Sie u. U. eine bessere Abdeckung, allerdings verlängert sich dadurch auch die Trainingsdauer. Der Standardwert ist 100.

numLeaves

Die maximale Anzahl von Blättern (Endknoten) an, die in einem Baum erstellt werden können. Höhere Werte können zwar den Baum vergrößern und die Genauigkeit verbessern, bergen aber das Risiko einer Überanpassung und erfordern längere Trainingszeiten. Der Standardwert lautet 20.

minSplit

Mindestanzahl von Trainingsinstanzen an, die für die Erstellung eines Blatts erforderlich sind. Das heißt, die minimale Anzahl von Dokumenten, die in einem Blatt eines Regressionsbaums aus den Daten mit untergeordneten Stichproben zulässig sind. Eine „Aufteilung“ bedeutet, dass Features auf jeder Ebene des Baums (Knotens) zufällig aufgeteilt werden. Der Standardwert ist 10.

exampleFraction

Der Anteil zufällig gewählter Instanzen, die für jeden Baum verwendet werden sollen. Der Standardwert ist 0,7.

featureFraction

Der Anteil zufällig gewählter Features, die für jeden Baum verwendet werden sollen. Der Standardwert ist 0,7.

splitFraction

Der Anteil zufällig gewählter Features, die für jede Aufteilung verwendet werden sollen. Der Standardwert ist 0,7.

numBins

Maximale Anzahl unterschiedlicher Werte (Bins) pro Feature. Der Standardwert ist 255.

firstUsePenalty

Das Feature verwendet zuerst den Strafkoeffizienten. Der Standardwert ist 0.

gainConfLevel

Konfidenzanforderung für die Baumanpassung (muss im Bereich [0,1] liegen). Der Standardwert ist 0.

trainThreads

Die Anzahl der Threads zum Trainieren des Modells. Falls NULL angegeben wird, wird die Anzahl der zu verwendenden Threads intern bestimmt. Der Standardwert ist NULL.

randomSeed

Gibt den zufälligen Ausgangswert an. Der Standardwert ist NULL.

...

Zusätzliche Argumente.