fastLinear: fastLinear
rxEnsemble을 사용하여 빠른 선형 모델을 학습하기 위한 함수 이름과 인수를 포함하는 목록을 만듭니다.
사용
fastLinear(lossFunction = NULL, l2Weight = NULL, l1Weight = NULL,
trainThreads = NULL, convergenceTolerance = 0.1, maxIterations = NULL,
shuffle = TRUE, checkFrequency = NULL, ...)
인수
lossFunction
최적화할 경험적 손실 함수를 지정합니다. 이진 분류의 경우 다음 선택 항목을 사용할 수 있습니다.
- logLoss: 로그 손실입니다. 이것이 기본값입니다.
- hingeLoss: SVM 힌지 손실입니다. 해당 매개 변수는 여백 크기를 나타냅니다.
- smoothHingeLoss: 평활화된 힌지 손실입니다. 해당 매개 변수는 다듬기 상수를 나타냅니다.
선형 회귀의 경우 현재 제곱 손실 squaredLoss가 지원됩니다. 이 매개 변수를NULL
으로 설정하면 기본값이 학습 유형에 따라 달라집니다. - 이진 분류의 경우 logLoss입니다.
- 선형 회귀의 경우 squaredLoss입니다.
l2Weight
L2 정규화 가중치를 지정합니다. 값은 음수가 아니거나 NULL
이어야 합니다. NULL
을 지정하면 실제 값이 데이터 세트에 따라 자동으로 계산됩니다. 기본값은 NULL
입니다.
l1Weight
L1 정규화 가중치를 지정합니다. 값은 음수가 아니거나 NULL
이어야 합니다. NULL
을 지정하면 실제 값이 데이터 세트에 따라 자동으로 계산됩니다. 기본값은 NULL
입니다.
trainThreads
알고리즘을 실행하는 데 사용할 수 있는 동시 스레드 수를 지정합니다. 이 매개 변수를 NULL
으로 설정하면 사용되는 스레드 수가 프로세스에 사용할 수 있는 논리 프로세서 수와 데이터 희박도에 따라 결정됩니다. 단일 스레드에서 알고리즘을 실행하려면 1
로 설정합니다.
convergenceTolerance
수렴 기준으로 사용되는 허용 오차 임계값을 지정합니다. 0에서 1 사이여야 합니다. 기본값은 0.1
입니다. 이 알고리즘은 이중성 간격과 원시 손실 간의 비율인 상대 이중성 간격이 지정된 수렴 허용 오차보다 낮은 경우 수렴된 것으로 간주됩니다.
maxIterations
학습 반복 횟수의 상한을 지정합니다. 이 매개 변수는 양수이거나 NULL
이어야 합니다. NULL
을 지정하면 실제 값이 데이터 세트에 따라 자동으로 계산됩니다. 반복할 때마다 학습 데이터 전체를 전달해야 합니다. 학습은 총 반복 횟수가 지정된 상한에 도달한 이후의 시간과 손실 함수가 수렴되는 시간 중 이른 시간에 종료됩니다.
shuffle
학습 데이터의 순서를 섞을지 여부를 지정합니다. 데이터 순서를 섞으려면 TRUE
로 설정하고, 순서를 섞지 않으려면 FALSE
로 설정합니다. 기본값은 TRUE
입니다. SDCA는 확률적 최적화 알고리즘입니다. 순서 섞기를 설정한 경우 반복할 때마다 학습 데이터 순서가 섞입니다.
checkFrequency
손실 함수가 계산되고 수렴되었는지 여부가 검사되는 반복 횟수입니다. 지정된 값은 양의 정수이거나 NULL
이어야 합니다. NULL
이면 실제 값이 데이터 세트에 따라 자동으로 계산됩니다. 예를 들어 checkFrequency = 5
를 지정하면 5회 반복마다 손실 함수가 계산되고 수렴이 검사됩니다. 손실 함수를 계산하려면 학습 데이터 전체를 별도로 전달해야 합니다.
...
추가 인수입니다.