Поделиться через


RegressionCatalog.CrossValidate Метод

Определение

Выполните перекрестную проверку по numberOfFolds сверткам data, установив estimatorи уважая samplingKeyColumnName при условии. Затем оцените каждую вложенную модель и labelColumnName метрики возврата.

public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.RegressionMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = "Label", string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.RegressionMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = "Label", Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of RegressionMetrics))

Параметры

data
IDataView

Данные для выполнения перекрестной проверки.

estimator
IEstimator<ITransformer>

Оценщик для соответствия.

numberOfFolds
Int32

Количество сверток перекрестной проверки.

labelColumnName
String

Столбец меток (для оценки).

samplingKeyColumnName
String

Имя столбца, используемого для группировки строк. Если два примера имеют одинаковое значение samplingKeyColumnName, они гарантированно будут отображаться в одном подмножестве (обучение или тестирование). Это можно использовать для обеспечения отсутствия утечки меток из поезда в тестовый набор. Если null группирование строк не будет выполнено.

seed
Nullable<Int32>

Начальное значение генератора случайных чисел, используемого для выбора строк для сверток перекрестной проверки.

Возвращаемое значение

Результаты по сверткам: метрики, модели, оцененные наборы данных.

Применяется к