ClusteringCatalog.CrossValidate Metoda
Definicja
Ważne
Niektóre informacje odnoszą się do produktu w wersji wstępnej, który może zostać znacząco zmodyfikowany przed wydaniem. Firma Microsoft nie udziela żadnych gwarancji, jawnych lub domniemanych, w odniesieniu do informacji podanych w tym miejscu.
Uruchom krzyżową walidację na numberOfFolds
fałdach data
, odpowiednio dopasowując estimator
element i szanując samplingKeyColumnName
, jeśli jest to podane.
Następnie należy ocenić każdy podmodel pod kątem labelColumnName
metryk i zwrócić je.
public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))
Parametry
- data
- IDataView
Dane do uruchamiania walidacji krzyżowej.
- estimator
- IEstimator<ITransformer>
Narzędzie do szacowania do dopasowania.
- numberOfFolds
- Int32
Liczba fałd krzyżowych walidacji.
- labelColumnName
- String
Opcjonalna kolumna etykiety do oceny (zadania klastrowania mogą nie zawsze mieć etykietę).
- featuresColumnName
- String
Opcjonalna kolumna cech do oceny (wymagana do obliczenia metryki Dbi)
- samplingKeyColumnName
- String
Nazwa kolumny do użycia do grupowania wierszy. Jeśli dwa przykłady mają taką samą wartość samplingKeyColumnName
, mają gwarancję, że pojawią się w tym samym podzestawie (trenowanie lub testowanie). Może to służyć do zapewnienia braku wycieku etykiety z pociągu do zestawu testowego.
Jeśli null
nie zostanie wykonane żadne grupowanie wierszy.
Inicjuj dla generatora liczb losowych używanych do wybierania wierszy do składania krzyżowego sprawdzania poprawności.