WordEmbeddingEstimator Clase

Definición

Caracterizador de texto que convierte vectores de tokens de texto en un vector numérico mediante un modelo de incrustación previamente entrenado.

public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>
type WordEmbeddingEstimator = class
    interface IEstimator<WordEmbeddingTransformer>
Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)
Herencia
WordEmbeddingEstimator
Implementaciones

Comentarios

Características del estimador

¿Este estimador necesita examinar los datos para entrenar sus parámetros? No
Tipo de datos de columna de entrada Vector de texto
Tipo de datos de columna de salida Vector de tamaño conocido de Single
Exportable a ONNX No

WordEmbeddingTransformer genera una nueva columna, denominada como se especifica en los parámetros de nombre de columna de salida, donde cada vector de entrada se asigna a un vector numérico con un tamaño de 3 * dimensionalidad del modelo de inserción utilizado. Observe que esto es independiente del tamaño del vector de entrada.

Por ejemplo, cuando se usa GloVe50D, que es 50 dimensional, la columna de salida es un vector de tamaño 150. El primer tercio de ranuras contiene los valores mínimos en las incrustaciones correspondientes a cada cadena del vector de entrada. El segundo tercero contiene el promedio de las incrustaciones. El último tercio de ranuras contiene los valores máximos de las incrustaciones encontradas. El valor mínimo/máximo proporciona un rectángulo de hiper rectángulo delimitador para las palabras en el espacio de inserción de palabras. Esto puede ayudar a frases más largas en las que el promedio de muchas palabras ahoga la señal útil.

El usuario puede especificar un modelo de inserción previamente entrenado personalizado o uno de los modelos previamente entrenados disponibles. Las opciones disponibles son varias versiones de GloVe Models, FastText y SSWE.

Consulte la sección Consulte también los vínculos a ejemplos de uso.

Métodos

Fit(IDataView)

Entrena y devuelve un WordEmbeddingTransformerobjeto .

GetOutputSchema(SchemaShape)

Devuelve el SchemaShape del esquema que generará el transformador. Se usa para la propagación y comprobación del esquema en una canalización.

Métodos de extensión

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Anexe un "punto de control de almacenamiento en caché" a la cadena del estimador. Esto garantizará que los estimadores de bajada se entrenarán con datos almacenados en caché. Resulta útil tener un punto de control de almacenamiento en caché antes de que los instructores tomen varios pases de datos.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dado un estimador, devuelva un objeto de ajuste que llamará a un delegado una vez Fit(IDataView) . A menudo, es importante que un estimador devuelva información sobre lo que cabe, por lo que el Fit(IDataView) método devuelve un objeto con tipo específico, en lugar de simplemente un general ITransformer. Sin embargo, al mismo tiempo, IEstimator<TTransformer> a menudo se forman en canalizaciones con muchos objetos, por lo que es posible que tengamos que crear una cadena de estimadores a través EstimatorChain<TLastTransformer> de donde el estimador para el que queremos obtener el transformador se enterró en algún lugar de esta cadena. En ese escenario, podemos a través de este método adjuntar un delegado al que se llamará una vez que se llame a fit.

Se aplica a

Consulte también