Поделиться через


ClusteringCatalog.CrossValidate Метод

Определение

Выполните перекрестную проверку по numberOfFolds сверткам data, путем установки estimatorи соблюдения samplingKeyColumnName при условии. Затем оцените каждую вложенную модель labelColumnName и метрики возврата.

public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))

Параметры

data
IDataView

Данные для выполнения перекрестной проверки.

estimator
IEstimator<ITransformer>

Оценщик для соответствия.

numberOfFolds
Int32

Количество сверток перекрестной проверки.

labelColumnName
String

Необязательный столбец меток для оценки (задачи кластеризации могут не всегда иметь метку).

featuresColumnName
String

Столбец дополнительных компонентов для оценки (требуется для вычисления метрики Dbi)

samplingKeyColumnName
String

Имя столбца, используемого для группировки строк. Если два примера имеют одно и то же значение samplingKeyColumnName, они гарантированно будут отображаться в одном подмножестве (обучение или тестирование). Это можно использовать, чтобы предотвратить утечку меток из поезда в тестовый набор. Если null группирование строк не будет выполнено.

seed
Nullable<Int32>

Начальное значение для генератора случайных чисел, используемого для выбора строк для сверток перекрестной проверки.

Возвращаемое значение

Применяется к