ClusteringCatalog.CrossValidate Метод
Определение
Важно!
Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.
Выполните перекрестную проверку по numberOfFolds
сверткам data
, путем установки estimator
и соблюдения samplingKeyColumnName
при условии.
Затем оцените каждую вложенную модель labelColumnName
и метрики возврата.
public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))
Параметры
- data
- IDataView
Данные для выполнения перекрестной проверки.
- estimator
- IEstimator<ITransformer>
Оценщик для соответствия.
- numberOfFolds
- Int32
Количество сверток перекрестной проверки.
- labelColumnName
- String
Необязательный столбец меток для оценки (задачи кластеризации могут не всегда иметь метку).
- featuresColumnName
- String
Столбец дополнительных компонентов для оценки (требуется для вычисления метрики Dbi)
- samplingKeyColumnName
- String
Имя столбца, используемого для группировки строк. Если два примера имеют одно и то же значение samplingKeyColumnName
, они гарантированно будут отображаться в одном подмножестве (обучение или тестирование). Это можно использовать, чтобы предотвратить утечку меток из поезда в тестовый набор.
Если null
группирование строк не будет выполнено.
Начальное значение для генератора случайных чисел, используемого для выбора строк для сверток перекрестной проверки.