ClusteringCatalog.CrossValidate 메서드

정의

접기data, 맞춤 estimator및 제공된 경우 존중을 samplingKeyColumnName 통해 numberOfFolds 교차 유효성 검사를 실행합니다. 그런 다음 각 하위 모델을 labelColumnName 평가하고 메트릭을 반환합니다.

public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))

매개 변수

data
IDataView

교차 유효성 검사를 실행할 데이터입니다.

estimator
IEstimator<ITransformer>

적합할 추정기입니다.

numberOfFolds
Int32

교차 유효성 검사 폴드 수입니다.

labelColumnName
String

평가를 위한 선택적 레이블 열입니다(클러스터링 작업에 항상 레이블이 있는 것은 아닐 수 있음).

featuresColumnName
String

평가를 위한 선택적 기능 열(Dbi 메트릭 계산에 필요)

samplingKeyColumnName
String

행 그룹화에 사용할 열의 이름입니다. 두 예제가 동일한 값을 samplingKeyColumnName공유하는 경우 동일한 하위 집합(학습 또는 테스트)에 표시되도록 보장됩니다. 이는 기차에서 테스트 세트로 레이블이 누출되지 않도록 하는 데 사용할 수 있습니다. 행 그룹화가 수행되지 않는 경우 null

seed
Nullable<Int32>

교차 유효성 검사 폴드에 대한 행을 선택하는 데 사용되는 난수 생성기의 시드입니다.

반환

적용 대상