logisticRegression: logisticRegression
Создает список, содержащий имя функции и аргументы, для обучения модели логистической регрессии с rxEnsemble.
Использование
logisticRegression(l2Weight = 1, l1Weight = 1, optTol = 1e-07,
memorySize = 20, initWtsScale = 0, maxIterations = 2147483647,
showTrainingStats = FALSE, sgdInitTol = 0, trainThreads = NULL,
denseOptimizer = FALSE, ...)
Аргументы
l2Weight
Весовой коэффициент регуляризации L2. Его значение должно быть больше или равно 0
, а по умолчанию задано значение 1
.
l1Weight
Весовой коэффициент регуляризации L1. Его значение должно быть больше или равно 0
, а по умолчанию задано значение 1
.
optTol
Пороговое значение для схождения оптимизатора. Если улучшение между итерациями меньше, чем пороговое значение, алгоритм прекращает работу и возвращает текущую модель. Чем меньше значение, тем алгоритм медленнее, но точнее. Значение по умолчанию — 1e-07
.
memorySize
Размер памяти для алгоритма L-BFGS, указывающий число сохраняемых последних позиций и градиентов для вычисления следующего шага. Этот параметр оптимизации ограничивает объем памяти, используемый для вычисления величины и направления следующего шага. Если указано меньшее количество памяти, обучение проходит быстрее, но является менее точным. Значение должно быть больше или равно 1
. Значение по умолчанию — 20
.
initWtsScale
Задает диаметр начальных весовых коэффициентов, который определяет диапазон, из которого берутся значения для первоначальных весовых коэффициентов. Такие весовые коэффициенты инициализируются случайным образом из этого диапазона. Например, если задан диаметр d
, весовые коэффициенты равномерно распределяются между -d/2
и d/2
. По умолчанию ему задано значение 0
. Это значит, что все весовые коэффициенты инициализируются со значением 0
.
maxIterations
Задает максимальное число итераций. После этого числа шагов алгоритм останавливает работу, даже если критерии схождения не выполнены.
showTrainingStats
Укажите TRUE
, чтобы отображать статистику по данным обучения и обученной модели. Если это не нужно, задайте FALSE
. Значение по умолчанию — FALSE
. Дополнительные сведения о статистике модели см. в статье, посвященной summary.mlModel.
sgdInitTol
Задайте число больше 0, чтобы использовать стохастический градиентный спуск (SGD) для поиска первоначальных параметров. Ненулевое значение указывает допуск, который используется SGD для определения схождения. Значение по умолчанию — 0
(указывает, что SGD не используется).
trainThreads
Число потоков для использования при обучении модели. Должно быть равно числу ядер на компьютере. Обратите внимание, что многопоточный алгоритм L-BFGS пытается загрузить набор данных в память. При возникновении проблем с нехваткой памяти задайте для trainThreads
значение 1
, чтобы отключить многопоточность. Если указано значение NULL
, число используемых потоков будет определяться внутренне. По умолчанию используется значение NULL
.
denseOptimizer
Если значение равно TRUE
, включается принудительное уплотнение внутренних векторов оптимизации. Если значение равно FALSE
, оптимизатор логистической регрессии может при необходимости использовать разреженные или уплотненные внутренние состояния. Если для denseOptimizer
задать значение TRUE
, внутреннему оптимизатору потребуется использовать уплотненное внутреннее состояние, что может снизить нагрузку на сборщик мусора при решении более крупных проблем.
...
Дополнительные аргументы.