fastTrees: fastTrees

Crea un elenco contenente il nome della funzione e gli argomenti per eseguire il training di un modello Fast Tree con rxEnsemble.

Utilizzo

  fastTrees(numTrees = 100, numLeaves = 20, learningRate = 0.2,
    minSplit = 10, exampleFraction = 0.7, featureFraction = 1,
    splitFraction = 1, numBins = 255, firstUsePenalty = 0,
    gainConfLevel = 0, unbalancedSets = FALSE, trainThreads = 8,
    randomSeed = NULL, ...)

Arguments

`numTrees`

Specifica il numero totale di alberi delle decisioni da creare nell'insieme. Creando più alberi delle decisioni, è possibile ottenere una migliore copertura, ma saranno necessari tempi di training prolungati. Il valore predefinito è 100.

`numLeaves`

Numero massimo di foglie (nodi di terminale) che è possibile creare in ogni albero. Valori più elevati aumentano potenzialmente le dimensioni dell'albero e consentono di ottenere una precisione migliore, ma rischiano di causare un overfitting e di richiedere tempi di training più lunghi. Il valore predefinito è 20.

`learningRate`

Determina le dimensioni del passaggio eseguito nella direzione del gradiente in ogni passaggio del processo di apprendimento. Questo valore determina quindi la velocità o la lentezza con cui lo strumento di apprendimento converge verso la soluzione ottimale. Se le dimensioni del passaggio sono eccessive, si rischia di oltrepassare la soluzione ottimale. Se la dimensione è troppo piccola, il training richiederà più tempo per convergere verso la soluzione migliore.

`minSplit`

Numero minimo di istanze di training necessarie per formare una foglia. Si tratta del numero minimo di documenti consentiti in una foglia di un albero di regressione, al di là dei dati sotto-campionati. Uno split indica che le funzionalità di ogni livello dell'albero (nodo) vengono divise in modo casuale. Il valore predefinito è 10. Viene conteggiato solo il numero di istanze, anche se le istanze sono ponderate.

`exampleFraction`

Frazione di istanze scelte in modo casuale da usare per ogni albero. Il valore predefinito è 0,7.

`featureFraction`

Frazione di funzionalità scelte in modo casuale da usare per ogni albero. Il valore predefinito è 1.

`splitFraction`

Frazione di funzionalità scelte in modo casuale da usare per ogni split. Il valore predefinito è 1.

`numBins`

Numero massimo di valori distinti (bin) per funzionalità. Se i valori della funzionalità sono di meno rispetto al numero indicato, ogni valore viene inserito nel bin corrispondente. Se sono presenti valori in più, l'algoritmo crea numBins bin.

`firstUsePenalty`

La funzionalità usa per primo il coefficiente di penalità. Si tratta di una forma di regolarizzazione che comporta una penalità per l'uso di una nuova funzionalità durante la creazione dell'albero. Aumentare questo valore per creare alberi che non usano molte funzionalità. Il valore predefinito è 0.

`gainConfLevel`

Requisito di attendibilità del guadagno di adattamento dell'albero. Il valore deve rientrare nell'intervallo [0,1]. Il valore predefinito è 0.

`unbalancedSets`

In caso di TRUE, vengono usati i derivati ottimizzati per i set non bilanciati. Si applica solo se type è uguale a "binary". Il valore predefinito è FALSE.

`trainThreads`

Numero di thread da usare nel training. Il valore predefinito è 8.

`randomSeed`

Specifica il valore di inizializzazione casuale. Il valore predefinito è NULL.

`...`

Argomenti aggiuntivi.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2025-01-02

fastTrees: fastTrees

Utilizzo

Arguments

numTrees

numLeaves

learningRate

minSplit

exampleFraction

featureFraction

splitFraction

numBins

firstUsePenalty

gainConfLevel

unbalancedSets

trainThreads

randomSeed

...