CountFeatureSelectingEstimator Classe

Definizione

Seleziona gli slot per i quali il conteggio dei valori non predefiniti è maggiore o uguale a una determinata soglia.

public sealed class CountFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type CountFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>
Public NotInheritable Class CountFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
Ereditarietà
CountFeatureSelectingEstimator
Implementazioni

Commenti

Caratteristiche dello strumento di stima

Questo stimatore deve esaminare i dati per eseguire il training dei relativi parametri?
Tipo di dati della colonna di input Vettore o scalare di tipi di SingleDouble dati o di testo
Tipo di dati della colonna di output Uguale alla colonna di input
Esportabile in ONNX

Questa trasformazione usa un set di aggregatori per contare il numero di valori per ogni slot (elemento vettore) non predefinito e non mancante (per le definizioni di impostazione predefinita e mancante, fare riferimento alla sezione osservazioni in DataKind). Se il valore del conteggio è minore del parametro conteggio specificato, tale slot viene eliminato. Questa trasformazione è utile quando viene applicata insieme a un OneHotHashEncodingTransformeroggetto . Può rimuovere le funzionalità generate dalla trasformazione hash che non hanno dati negli esempi.

Ad esempio, se si imposta il parametro count su 3 e si adatta lo strumento di stima, applicare il trasformatore alla colonna Features seguente, si vedrà il secondo slot, contenente: NaN (valore mancante), 5, 5, 0 (valore predefinito) che viene eliminato perché tale slot include solo due valori non predefiniti e non mancanti, ad esempio i due 5 valori. Il terzo slot viene mantenuto, perché ha i valori 6, 6, 6, NaN; quindi ha 3 non predefiniti e non mancanti.

Funzionalità
4,NaN,6
4,5,6
4,5,6
4.0,NaN

Questo è il modo in cui il set di dati precedente verrà esaminato dopo la trasformazione.

Funzionalità
4,6
4,6
4,6
4,NaN

Controllare la sezione Vedere anche i collegamenti agli esempi di utilizzo.

Metodi

Fit(IDataView)

Esegue il training e restituisce un ITransformeroggetto .

GetOutputSchema(SchemaShape)

Restituisce l'oggetto SchemaShape dello schema che verrà prodotto dal trasformatore. Usato per la propagazione e la verifica dello schema in una pipeline.

Metodi di estensione

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training sui dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima dei training che accettano più passaggi di dati.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dato un stimatore, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. Spesso è importante che un stimatore restituisca informazioni su ciò che è stato adatto, che è il motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> sono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di stima tramite EstimatorChain<TLastTransformer> dove lo stimatore per cui si vuole ottenere il trasformatore è sepolto da qualche parte in questa catena. Per questo scenario, è possibile collegare questo metodo a un delegato che verrà chiamato una volta chiamato fit.

Si applica a

Vedi anche