logisticRegression:logisticRegression

创建一个包含函数名称和参数的列表,以使用 rxEnsemble 训练逻辑回归模型。

用法

  logisticRegression(l2Weight = 1, l1Weight = 1, optTol = 1e-07,
    memorySize = 20, initWtsScale = 0, maxIterations = 2147483647,
    showTrainingStats = FALSE, sgdInitTol = 0, trainThreads = NULL,
    denseOptimizer = FALSE, ...)
 

参数

l2Weight

L2 正则化权重。 其值必须大于或等于 0,并且默认值设置为 1

l1Weight

L1 正则化权重。 其值必须大于或等于 0,并且默认值设置为 1

optTol

优化器收敛的阈值。 如果迭代间的改进小于阈值,则算法将停止并返回当前模型。 值越小,收敛速度越慢,但准确性越高。 默认值是 1e-07

memorySize

L-BFGS 的内存大小,用于指定存储以用于计算下一个步长的过去位置和梯度的数量。 此优化参数限制用于计算下一个步长的幅度和方向的内存量。 指定的内存越少,训练越快,但准确性越低。 必须大于或等于 1,并且默认值为 20

initWtsScale

设置初始权重直径,该直径指定为初始权重采用的值范围。 这些权重在此范围内随机初始化。 例如,如果将直径指定为 d,则权重在 -d/2d/2 之间均匀分布。 默认值为 0,它指定将所有权重都初始化为 0

maxIterations

设置最大迭代次数。 在此步长数之后,即使算法没有达到收敛标准,它也会停止。

showTrainingStats

如果要显示训练数据和训练模型的统计信息,请指定为 TRUE;否则指定为 FALSE。 默认值是 FALSE。 有关模型统计信息的其他信息,请参阅 summary.mlModel

sgdInitTol

如果要使用随机梯度下降 (SGD) 来查找初始参数,请设置为大于 0 的数字。 非零值集指定 SGD 用于确定收敛的容差。 默认值为 0,用于指定不使用 SGD。

trainThreads

用于训练模型的线程数。 该参数应设置为计算机上的内核数。 请注意,L-BFGS 多线程尝试将数据集加载到内存中。 如果出现内存不足问题,请将 trainThreads 设置为 1 以关闭多线程。 如果为 NULL,则要使用的线程数在内部确定。 默认值是 NULL

denseOptimizer

如果设置为 TRUE,则强制内部优化向量的致密化。 如果设置为 FALSE,则可让逻辑回归优化器使用它认为合适的稀疏或密集内部状态。 如果将 denseOptimizer 设置为 TRUE,则要求内部优化器使用密集内部状态,这可能有助于减轻垃圾回收器的负载,以应对一些较大的问题。

...

其他参数。