fastForest : fastForest
Crée une liste contenant le nom et les arguments de la fonction pour effectuer l’apprentissage d’un modèle de forêt rapide avec rxEnsemble.
Utilisation
fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
trainThreads = 8, randomSeed = NULL, ...)
Arguments
numTrees
Indique le nombre total d’arbres de décision à créer dans l’ensemble. En créant davantage d’arbres de décision, vous pouvez potentiellement obtenir une meilleure couverture, mais le temps d’apprentissage augmente. La valeur par défaut est 100.
numLeaves
Nombre maximal de feuilles (nœuds terminaux) qui peuvent être créées dans un arbre. Les valeurs plus élevées augmentent potentiellement la taille de l’arborescence et bénéficient d’une meilleure précision, mais entraîne le surajustement des risques, et les temps d’apprentissage sont plus longs. La valeur par défaut est 20.
minSplit
Nombre minimal d'instances de formation requises pour former une feuille. Autrement dit, le nombre minimal de documents autorisés dans une feuille d’un arbre de régression, en dehors des données sous-échantillonnées. Le fractionnement consiste à diviser de manière aléatoire les caractéristiques à chaque niveau de l’arbre (nœud). La valeur par défaut est 10.
exampleFraction
Fraction d’instances choisies de façon aléatoire à utiliser pour chaque arborescence. La valeur par défaut est 0,7.
featureFraction
Fraction de caractéristiques choisies de façon aléatoire à utiliser pour chaque arborescence. La valeur par défaut est 0,7.
splitFraction
Fraction de caractéristiques choisies de façon aléatoire à utiliser pour chaque fractionnement. La valeur par défaut est 0,7.
numBins
Nombre maximal de valeurs distinctes (emplacements) par fonctionnalité. La valeur par défaut est 255.
firstUsePenalty
La caractéristique utilise tout d’abord le coefficient de pénalité. La valeur par défaut est 0.
gainConfLevel
L’exigence de confiance de gain de l’arbre doit être comprise dans la plage (0,1). La valeur par défaut est 0.
trainThreads
Nombre de threads à utiliser pour la formation. Si NULL
est défini, le nombre de threads utilisés est déterminé en interne. La valeur par défaut est NULL
.
randomSeed
Spécifie la valeur de départ aléatoire. La valeur par défaut est NULL
.
...
Arguments supplémentaires.