OneHotHashEncodingEstimator Classe
Definizione
Importante
Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.
Converte una o più colonne di input di valori categorici in quante colonne di output di vettori con codifica one-hot basati su hash.
public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
- Ereditarietà
-
OneHotHashEncodingEstimator
- Implementazioni
Commenti
Caratteristiche dello strumento di stima
Questo strumento di stima deve esaminare i dati per eseguire il training dei relativi parametri? | Sì |
Tipo di dati della colonna di input | Scalare o vettore di tipo numerico, booleano, testo o chiave . |
Tipo di dati della colonna di output | Scalare o vettore di chiave o vettore di Single tipo . |
Esportabile in ONNX | No |
L'oggetto risultante OneHotEncodingTransformer converte una o più colonne di input in tutte le colonne di output di vettori con codifica one-hot, in cui l'indicizzazione viene eseguita eseguendo l'hashing del valore e usando l'hash come indice.
Viene OneHotEncodingEstimator spesso usato per convertire i dati categorici in un modulo che può essere fornito a un algoritmo di Machine Learning.
L'output di questa trasformazione viene specificato da OneHotEncodingEstimator.OutputKind:
Indicator produce un vettore di indicatore. Ogni slot in questo vettore corrisponde a una categoria nel dizionario, quindi la sua lunghezza è la dimensione del dizionario compilato. Se un valore non viene trovato nel dizionario, l'output è il vettore zero.
Bag produce un vettore in modo che ogni slot archivii il numero di occorrenze del valore corrispondente nel vettore di input. Ogni slot in questo vettore corrisponde a un valore nel dizionario, quindi la sua lunghezza è la dimensione del dizionario compilato. Indicator e Bag differiscono semplicemente nel modo in cui i vettori di bit generati dai singoli slot nella colonna di input vengono aggregati: per Indicatore vengono concatenati e per Bag vengono aggiunti. Quando la colonna di origine è scalare, le opzioni Indicatore e Contenitore sono identiche.
Key produce chiavi in una KeyDataViewType colonna. Se la colonna di input è un vettore, l'output contiene un tipo di chiave vettoriale, dove ogni slot del vettore corrisponde al rispettivo slot del vettore di input. Se non viene trovata una categoria nel dizionario compilato, viene assegnato il valore zero.
Binary produce un vettore con codifica binaria per rappresentare i valori trovati nel dizionario presenti nella colonna di input. Se un valore nella colonna di input non viene trovato nel dizionario, l'output è il vettore zero.
OneHotEncodingTransformer può essere applicato a una o più colonne, nel qual caso compila e usa un dizionario separato per ogni colonna a cui viene applicato.
Vedere la sezione Vedere anche i collegamenti agli esempi di utilizzo.
Metodi
Fit(IDataView) |
Esegue il training e restituisce un oggetto OneHotHashEncodingTransformer. |
GetOutputSchema(SchemaShape) |
Restituisce l'oggetto SchemaShape dello schema che verrà prodotto dal trasformatore. Usato per la propagazione e la verifica dello schema in una pipeline. |
Metodi di estensione
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training in base ai dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima che i formatori eseseguono più passaggi di dati. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Dato un estimator, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. È spesso importante che uno strumento di stima restituisca informazioni sull'adattamento, motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> vengono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di estimatori tramite EstimatorChain<TLastTransformer> dove lo strumento di stima per il quale si vuole ottenere il trasformatore è sepolto in una posizione in questa catena. Per questo scenario, è possibile collegare un delegato che verrà chiamato una volta chiamato fit. |