WordEmbeddingEstimator Classe

Definizione

Funzionalità di testo che converte i vettori di token di testo in un vettore numerico usando un modello di incorporamento con training preliminare.

public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>
type WordEmbeddingEstimator = class
    interface IEstimator<WordEmbeddingTransformer>
Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)
Ereditarietà
WordEmbeddingEstimator
Implementazioni

Commenti

Caratteristiche dello strumento di stima

Questo strumento di stima deve esaminare i dati per eseguire il training dei relativi parametri? No
Tipo di dati della colonna di input Vettore di testo
Tipo di dati della colonna di output Vettore di dimensioni note di Single
Esportabile in ONNX No

Produce WordEmbeddingTransformer una nuova colonna, denominata come specificato nei parametri del nome della colonna di output, in cui ogni vettore di input viene mappato a un vettore numerico con dimensioni pari a 3 * dimensionalità del modello di incorporamento usato. Si noti che si tratta di un valore indipendente dalle dimensioni del vettore di input.

Ad esempio, quando si usa GloVe50D, che è 50 dimensionale, la colonna di output è un vettore di dimensioni 150. Il primo terzo degli slot contiene i valori minimi tra gli incorporamenti corrispondenti a ogni stringa nel vettore di input. Il secondo terzo contiene la media degli incorporamenti. L'ultimo terzo degli slot contiene i valori massimi degli incorporamenti rilevati. Il valore min/max fornisce un rettangolo di delimitazione per le parole nello spazio di incorporamento delle parole. Questo può essere utile per frasi più lunghe in cui la media di molte parole annega il segnale utile.

L'utente può specificare un modello di incorporamenti con training preliminare personalizzato o uno dei modelli con training preliminare disponibili. Le opzioni disponibili sono diverse versioni di Modelli GloVe, FastText e SSWE.

Vedere la sezione Vedere anche i collegamenti agli esempi di utilizzo.

Metodi

Fit(IDataView)

Esegue il training e restituisce un oggetto WordEmbeddingTransformer.

GetOutputSchema(SchemaShape)

Restituisce l'oggetto SchemaShape dello schema che verrà prodotto dal trasformatore. Usato per la propagazione e la verifica dello schema in una pipeline.

Metodi di estensione

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training in base ai dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima che i formatori eseseguono più passaggi di dati.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dato un estimator, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. È spesso importante che uno strumento di stima restituisca informazioni sull'adattamento, motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> vengono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di estimatori tramite EstimatorChain<TLastTransformer> dove lo strumento di stima per il quale si vuole ottenere il trasformatore è sepolto in una posizione in questa catena. Per questo scenario, è possibile collegare un delegato che verrà chiamato una volta chiamato fit.

Si applica a

Vedi anche