BinaryClassificationCatalog.CrossValidate Метод
Определение
Важно!
Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.
Выполните перекрестную проверку по numberOfFolds
сверткам data
, установив estimator
и уважая samplingKeyColumnName
при условии.
Затем оцените каждую вложенную модель labelColumnName
и верните CalibratedBinaryClassificationMetrics объект, который включает метрики на основе вероятностей для каждой под модели. Каждая вложенная модель оценивается на свертывание перекрестной проверки, которую она не видела во время обучения.
public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.CalibratedBinaryClassificationMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = "Label", string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.CalibratedBinaryClassificationMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = "Label", Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of CalibratedBinaryClassificationMetrics))
Параметры
- data
- IDataView
Данные для выполнения перекрестной проверки.
- estimator
- IEstimator<ITransformer>
Оценщик для соответствия.
- numberOfFolds
- Int32
Количество сверток перекрестной проверки.
- labelColumnName
- String
Столбец меток (для оценки).
- samplingKeyColumnName
- String
Имя столбца, используемого для группировки строк. Если два примера имеют одинаковое значение samplingKeyColumnName
, они гарантированно будут отображаться в одном подмножестве (обучение или тестирование). Это можно использовать для обеспечения отсутствия утечки меток из поезда в тестовый набор.
Если null
группирование строк не будет выполнено.
Начальное значение генератора случайных чисел, используемого для выбора строк для сверток перекрестной проверки.
Возвращаемое значение
Результаты по сверткам: метрики, модели, оцененные наборы данных.