WordEmbeddingEstimator Classe
Definição
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Recurso de texto que converte vetores de tokens de texto em um vetor numérico usando um modelo de incorporações pré-treinado.
public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>
type WordEmbeddingEstimator = class
interface IEstimator<WordEmbeddingTransformer>
Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)
- Herança
-
WordEmbeddingEstimator
- Implementações
Comentários
Características do estimador
Esse estimador precisa examinar os dados para treinar seus parâmetros? | No |
Tipo de dados de coluna de entrada | Vetor de texto |
Tipo de dados de coluna de saída | Vetor de tamanho conhecido de Single |
Exportável para ONNX | No |
Produz WordEmbeddingTransformer uma nova coluna, nomeada conforme especificado nos parâmetros de nome da coluna de saída, em que cada vetor de entrada é mapeado para um vetor numérico com tamanho de 3 * dimensionalidade do modelo de inserção usado. Observe que isso é independente do tamanho do vetor de entrada.
Por exemplo, ao usar GloVe50D, que é 50 dimensional, a coluna de saída é um vetor do tamanho 150. O primeiro terço dos slots contém os valores mínimos entre as incorporações correspondentes a cada cadeia de caracteres no vetor de entrada. O segundo terço contém a média das inserções. O último terço dos slots contém valores máximos das inserções encontradas. O min/max fornece um hipertângulo delimitador para as palavras na palavra espaço de inserção. Isso pode ajudar em frases mais longas em que a média de muitas palavras abafia o sinal útil.
O usuário pode especificar um modelo de inserção pré-treinado personalizado ou um dos modelos pré-treinados disponíveis. As opções disponíveis são várias versões de Modelos GloVe, FastText e SSWE.
Verifique a seção Consulte Também para obter links para exemplos de uso.
Métodos
Fit(IDataView) |
Treina e retorna um WordEmbeddingTransformer. |
GetOutputSchema(SchemaShape) |
Retorna o SchemaShape esquema que será produzido pelo transformador. Usado para propagação e verificação de esquema em um pipeline. |
Métodos de Extensão
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Acrescente um "ponto de verificação de cache" à cadeia de estimativas. Isso garantirá que os estimadores downstream serão treinados em relação aos dados armazenados em cache. É útil ter um ponto de verificação de cache antes dos treinadores que fazem várias passagens de dados. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Dado um estimador, retorne um objeto de encapsulamento que chamará um delegado uma vez Fit(IDataView) chamado. Geralmente, é importante que um estimador retorne informações sobre o que estava em forma, e é por isso que o Fit(IDataView) método retorna um objeto especificamente tipado, em vez de apenas um geral ITransformer. No entanto, ao mesmo tempo, IEstimator<TTransformer> muitas vezes são formados em pipelines com muitos objetos, portanto, talvez seja necessário construir uma cadeia de estimadores por meio EstimatorChain<TLastTransformer> de onde o estimador para o qual queremos que o transformador seja enterrado em algum lugar nesta cadeia. Para esse cenário, podemos por meio desse método anexar um delegado que será chamado quando fit for chamado. |