WordEmbeddingEstimator Classe

Riferimento

Definizione

Spazio dei nomi:: Microsoft.ML.Transforms.Text

Assembly:: Microsoft.ML.Transforms.dll

Pacchetto:: Microsoft.ML v3.0.1

Pacchetto:: Microsoft.ML v1.0.0

Pacchetto:: Microsoft.ML v1.1.0

Pacchetto:: Microsoft.ML v1.2.0

Pacchetto:: Microsoft.ML v1.3.1

Pacchetto:: Microsoft.ML v1.4.0

Pacchetto:: Microsoft.ML v1.5.5

Pacchetto:: Microsoft.ML v1.6.0

Pacchetto:: Microsoft.ML v1.7.0

Pacchetto:: Microsoft.ML v2.0.0

Importante

Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.

Funzionalità di testo che converte i vettori di token di testo in un vettore numerico usando un modello di incorporamento con training preliminare.

public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>

type WordEmbeddingEstimator = class
    interface IEstimator<WordEmbeddingTransformer>

Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)

Ereditarietà: Object
WordEmbeddingEstimator

Implementazioni: IEstimator<WordEmbeddingTransformer>

Commenti

Caratteristiche dello strumento di stima


Questo strumento di stima deve esaminare i dati per eseguire il training dei relativi parametri?	No
Tipo di dati della colonna di input	Vettore di testo
Tipo di dati della colonna di output	Vettore di dimensioni note di Single
Esportabile in ONNX	No

Produce WordEmbeddingTransformer una nuova colonna, denominata come specificato nei parametri del nome della colonna di output, in cui ogni vettore di input viene mappato a un vettore numerico con dimensioni pari a 3 * dimensionalità del modello di incorporamento usato. Si noti che si tratta di un valore indipendente dalle dimensioni del vettore di input.

Ad esempio, quando si usa GloVe50D, che è 50 dimensionale, la colonna di output è un vettore di dimensioni 150. Il primo terzo degli slot contiene i valori minimi tra gli incorporamenti corrispondenti a ogni stringa nel vettore di input. Il secondo terzo contiene la media degli incorporamenti. L'ultimo terzo degli slot contiene i valori massimi degli incorporamenti rilevati. Il valore min/max fornisce un rettangolo di delimitazione per le parole nello spazio di incorporamento delle parole. Questo può essere utile per frasi più lunghe in cui la media di molte parole annega il segnale utile.

L'utente può specificare un modello di incorporamenti con training preliminare personalizzato o uno dei modelli con training preliminare disponibili. Le opzioni disponibili sono diverse versioni di Modelli GloVe, FastText e SSWE.

Vedere la sezione Vedere anche i collegamenti agli esempi di utilizzo.

Metodi

Fit(IDataView)	Esegue il training e restituisce un oggetto WordEmbeddingTransformer.
GetOutputSchema(SchemaShape)	Restituisce l'oggetto SchemaShape dello schema che verrà prodotto dal trasformatore. Usato per la propagazione e la verifica dello schema in una pipeline.

Metodi di estensione

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training in base ai dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima che i formatori eseseguono più passaggi di dati.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dato un estimator, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. È spesso importante che uno strumento di stima restituisca informazioni sull'adattamento, motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> vengono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di estimatori tramite EstimatorChain<TLastTransformer> dove lo strumento di stima per il quale si vuole ottenere il trasformatore è sepolto in una posizione in questa catena. Per questo scenario, è possibile collegare un delegato che verrà chiamato una volta chiamato fit.

Si applica a