TransformsCatalog.TextTransforms Clase

Referencia

Definición

Espacio de nombres:: Microsoft.ML

Ensamblado:: Microsoft.ML.Data.dll

Paquete:: Microsoft.ML v3.0.1

Paquete:: Microsoft.ML v1.0.0

Paquete:: Microsoft.ML v1.1.0

Paquete:: Microsoft.ML v1.2.0

Paquete:: Microsoft.ML v1.3.1

Paquete:: Microsoft.ML v1.4.0

Paquete:: Microsoft.ML v1.5.5

Paquete:: Microsoft.ML v1.6.0

Paquete:: Microsoft.ML v1.7.0

Paquete:: Microsoft.ML v2.0.0

Importante

Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.

Clase usada por MLContext para crear instancias de componentes de transformación de datos de texto.

public sealed class TransformsCatalog.TextTransforms

type TransformsCatalog.TextTransforms = class

Public NotInheritable Class TransformsCatalog.TextTransforms

Herencia: Object
TransformsCatalog.TextTransforms

Métodos de extensión

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	Cree un WordEmbeddingEstimator, que es un caracterizador de texto que convierte un vector de texto en un vector numérico mediante modelos de incrustación previamente entrenados.
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	Cree un WordEmbeddingEstimator, que es un caracterizador de texto que convierte vectores de texto en vectores numéricos mediante modelos de incrustación previamente entrenados.
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	Cree un TextFeaturizingEstimatorobjeto , que transforma una columna de texto en vector con caracterización de Single que representa recuentos normalizados de n-gramas y caracteres.
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	Cree un TextFeaturizingEstimatorobjeto , que transforma una columna de texto en un vector con características de Single que representa recuentos normalizados de n-gramas y caracteres.
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	Cree un LatentDirichletAllocationEstimatorobjeto , que usa LightLDA para transformar texto (representado como vector de floats) en un vector de Single que indique la similitud del texto con cada tema identificado.
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	Crea un TextNormalizingEstimatorobjeto , que normaliza el texto entrante en `inputColumnName` cambiando opcionalmente mayúsculas de minúsculas, quitando marcas diacríticas, signos de puntuación, números y genera texto nuevo como `outputColumnName`.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Cree un NgramHashingEstimatorobjeto , que copia los datos de la columna especificada en `inputColumnName` en una nueva columna: `outputColumnName` y genera un vector de recuentos de n-gramas con hash.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Cree un NgramHashingEstimatorobjeto , que toma los datos de las varias columnas especificadas en `inputColumnNames` una nueva columna: `outputColumnName` y genera un vector de recuentos de n-gramas con hash.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Cree un WordHashBagEstimatorobjeto , que asigna la columna especificada en `inputColumnName` a un vector de recuentos de n-gramas con hash en una nueva columna denominada `outputColumnName`.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Cree un WordHashBagEstimatorobjeto , que asigna las varias columnas especificadas en `inputColumnNames` a un vector de recuentos de n-gramas con hash en una nueva columna denominada `outputColumnName`.
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Crea un NgramExtractingEstimator objeto que genera un vector de recuentos de n-gramas (secuencias de palabras consecutivas) encontrados en el texto de entrada.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	Cree un WordBagEstimatorobjeto , que asigna la columna especificada en `inputColumnName` a un vector de recuentos de n-gramas en una nueva columna denominada `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Cree un WordBagEstimatorobjeto , que asigna la columna especificada en `inputColumnName` a un vector de recuentos de n-gramas en una nueva columna denominada `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Cree un WordBagEstimatorobjeto , que asigna las varias columnas especificadas en `inputColumnNames` a un vector de recuentos de n-gramas en una nueva columna denominada `outputColumnName`.
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	Cree un CustomStopWordsRemovingEstimatorobjeto , que copia los datos de la columna especificada en `inputColumnName` en una nueva columna: `outputColumnName` y quita el conjunto predifined de texto específico para `language` él.
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	Cree un CustomStopWordsRemovingEstimatorobjeto , que copia los datos de la columna especificada en `inputColumnName` en una nueva columna: `outputColumnName` y quita el texto especificado en `stopwords` de ella.
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	Cree un TokenizingByCharactersEstimatorobjeto , que tokeniza dividiendo el texto en secuencias de caracteres mediante una ventana deslizante.
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	Cree un WordTokenizingEstimatorobjeto , que tokeniza el texto de entrada mediante `separators` como separadores.

Se aplica a

TransformsCatalog.TextTransforms Clase

Definición

Métodos de extensión

Se aplica a

Comentarios

Recursos adicionales