Compartilhar via


fastTrees: fastTrees

Cria uma lista que contém o nome e os argumentos da função para treinar um modelo de FastTree com rxEnsemble.

Uso

  fastTrees(numTrees = 100, numLeaves = 20, learningRate = 0.2,
    minSplit = 10, exampleFraction = 0.7, featureFraction = 1,
    splitFraction = 1, numBins = 255, firstUsePenalty = 0,
    gainConfLevel = 0, unbalancedSets = FALSE, trainThreads = 8,
    randomSeed = NULL, ...)
 

Argumentos

numTrees

Especifica o número total de árvores de decisão a serem criadas no ensemble. Criando mais árvores de decisão, você tem o potencial de obter uma melhor cobertura, mas o tempo de treinamento aumenta. O valor padrão é 100.

numLeaves

O número máximo de folhas (nós de terminal) que podem ser criadas em uma árvore. Valores mais altos podem aumentar o tamanho da árvore e melhorar a precisão, mas há um risco de sobreajuste e de necessidade de mais tempo de treinamento. O valor padrão é 20.

learningRate

Determina o tamanho da etapa realizada na direção do gradiente em cada etapa do processo de aprendizado. Determina a velocidade em que o aprendiz é convergido na solução ideal. Se o tamanho da etapa for muito grande, você poderá exceder a solução ideal. Se o tamanho da etapa muito pequeno, o treinamento vai demorar mais para ser convergido na melhor solução.

minSplit

Número mínimo de instâncias de treinamento necessárias para formar uma folha. Ou seja, o número mínimo de documentos permitidos em uma folha de uma árvore de regressão, fora dos dados subamostrados. Uma "divisão" significa que os recursos em cada nível da árvore (nó) são divididos aleatoriamente. O valor padrão é 10. Somente o número de instâncias é contado, mesmo que as instâncias sejam ponderadas.

exampleFraction

A fração de instâncias escolhidas aleatoriamente a ser usada para cada árvore. O valor padrão é 0,7.

featureFraction

A fração de recursos escolhidos aleatoriamente a ser usada para cada árvore. O valor padrão é 1.

splitFraction

A fração de recursos escolhidos aleatoriamente a ser usada em cada divisão. O valor padrão é 1.

numBins

Número máximo de valores distintos (compartimentos) por recurso. Se o recurso tiver menos valores do que o número indicado, cada valor será colocado no respectivo compartimento. Se houver mais valores, o algoritmo criará numBins compartimentos.

firstUsePenalty

O recurso primeiro usa o coeficiente de penalidade. Essa é uma forma de regularização que gera uma penalidade pelo uso de um novo recurso ao criar a árvore. Aumente esse valor para criar árvores que não usam muitos recursos. O valor padrão é 0.

gainConfLevel

Requisito de confiança de ganho de ajuste da árvore (deve estar no intervalo [0,1]). O valor padrão é 0.

unbalancedSets

Se definido como TRUE, as derivadas otimizadas para conjuntos não balanceadas são usadas. Aplicável somente quando type é igual a "binary". O valor padrão é FALSE.

trainThreads

O número de threads a serem usados no treinamento. O valor padrão é 8.

randomSeed

Especifica a semente aleatória. O valor padrão é NULL.

...

Argumentos adicionais.