CountFeatureSelectingEstimator Classe
Definizione
Importante
Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.
Seleziona gli slot per i quali il conteggio dei valori non predefiniti è maggiore o uguale a una determinata soglia.
public sealed class CountFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type CountFeatureSelectingEstimator = class
interface IEstimator<ITransformer>
Public NotInheritable Class CountFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
- Ereditarietà
-
CountFeatureSelectingEstimator
- Implementazioni
Commenti
Caratteristiche dello strumento di stima
Questo stimatore deve esaminare i dati per eseguire il training dei relativi parametri? | Sì |
Tipo di dati della colonna di input | Vettore o scalare di tipi di SingleDouble dati o di testo |
Tipo di dati della colonna di output | Uguale alla colonna di input |
Esportabile in ONNX | Sì |
Questa trasformazione usa un set di aggregatori per contare il numero di valori per ogni slot (elemento vettore) non predefinito e non mancante (per le definizioni di impostazione predefinita e mancante, fare riferimento alla sezione osservazioni in DataKind). Se il valore del conteggio è minore del parametro conteggio specificato, tale slot viene eliminato. Questa trasformazione è utile quando viene applicata insieme a un OneHotHashEncodingTransformeroggetto . Può rimuovere le funzionalità generate dalla trasformazione hash che non hanno dati negli esempi.
Ad esempio, se si imposta il parametro count su 3 e si adatta lo strumento di stima, applicare il trasformatore alla colonna Features seguente, si vedrà il secondo slot, contenente: NaN (valore mancante), 5, 5, 0 (valore predefinito) che viene eliminato perché tale slot include solo due valori non predefiniti e non mancanti, ad esempio i due 5 valori. Il terzo slot viene mantenuto, perché ha i valori 6, 6, 6, NaN; quindi ha 3 non predefiniti e non mancanti.
Funzionalità |
---|
4,NaN,6 |
4,5,6 |
4,5,6 |
4.0,NaN |
Questo è il modo in cui il set di dati precedente verrà esaminato dopo la trasformazione.
Funzionalità |
---|
4,6 |
4,6 |
4,6 |
4,NaN |
Controllare la sezione Vedere anche i collegamenti agli esempi di utilizzo.
Metodi
Fit(IDataView) |
Esegue il training e restituisce un ITransformeroggetto . |
GetOutputSchema(SchemaShape) |
Restituisce l'oggetto SchemaShape dello schema che verrà prodotto dal trasformatore. Usato per la propagazione e la verifica dello schema in una pipeline. |
Metodi di estensione
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training sui dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima dei training che accettano più passaggi di dati. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Dato un stimatore, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. Spesso è importante che un stimatore restituisca informazioni su ciò che è stato adatto, che è il motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> sono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di stima tramite EstimatorChain<TLastTransformer> dove lo stimatore per cui si vuole ottenere il trasformatore è sepolto da qualche parte in questa catena. Per questo scenario, è possibile collegare questo metodo a un delegato che verrà chiamato una volta chiamato fit. |