TextCatalog Clase

Referencia

Definición

Espacio de nombres:: Microsoft.ML

Ensamblado:: Microsoft.ML.Transforms.dll

Paquete:: Microsoft.ML v3.0.1

Paquete:: Microsoft.ML v1.0.0

Paquete:: Microsoft.ML v1.1.0

Paquete:: Microsoft.ML v1.2.0

Paquete:: Microsoft.ML v1.3.1

Paquete:: Microsoft.ML v1.4.0

Paquete:: Microsoft.ML v1.5.5

Paquete:: Microsoft.ML v1.6.0

Paquete:: Microsoft.ML v1.7.0

Paquete:: Microsoft.ML v2.0.0

Importante

Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.

Colección de métodos de extensión para .TransformsCatalog

public static class TextCatalog

type TextCatalog = class

Public Module TextCatalog

Herencia: Object
TextCatalog

Métodos

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	Cree un WordEmbeddingEstimator, que es un caracterizador de texto que convierte vectores de texto en vectores numéricos mediante modelos de incrustaciones previamente entrenadas.
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	Cree un WordEmbeddingEstimator, que es un caracterizador de texto que convierte un vector de texto en un vector numérico mediante modelos de incrustaciones previamente entrenadas.
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	Cree un TextFeaturizingEstimator, que transforma una columna de texto en un vector con caracterización de Single que representa recuentos normalizados de n-gramas y char-gramas.
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	Cree un TextFeaturizingEstimator, que transforma una columna de texto en vector con caracterización de Single que representa recuentos normalizados de n-gramas y char-gramas.
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	Cree un LatentDirichletAllocationEstimatorobjeto , que usa LightLDA para transformar el texto (representado como vector de floats) en un vector de Single que indique la similitud del texto con cada tema identificado.
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	Crea un TextNormalizingEstimator, que normaliza el texto entrante en `inputColumnName` cambiando opcionalmente mayúsculas y minúsculas, quitando marcas diacríticas, signos de puntuación, números y genera texto nuevo como `outputColumnName`.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Cree un NgramHashingEstimator, que copia los datos de la columna especificada en `inputColumnName` en una nueva columna: `outputColumnName` y genera un vector de recuentos de n-gramas con hash.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Cree un NgramHashingEstimator, que toma los datos de las varias columnas especificadas en `inputColumnNames` en una nueva columna: `outputColumnName` y genera un vector de recuentos de n-gramas con hash.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Cree un WordHashBagEstimatorobjeto , que asigna la columna especificada en `inputColumnName` a un vector de recuentos de n-gramas con hash en una nueva columna denominada `outputColumnName`.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Cree un WordHashBagEstimator, que asigna las varias columnas especificadas en `inputColumnNames` a un vector de recuentos de n-gramas con hash en una nueva columna denominada `outputColumnName`.
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Crea un objeto NgramExtractingEstimator que genera un vector de recuentos de n-gramas (secuencias de palabras consecutivas) encontrados en el texto de entrada.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	Cree un WordBagEstimatorobjeto , que asigna la columna especificada en `inputColumnName` a un vector de recuentos de n-gramas en una nueva columna denominada `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Cree un WordBagEstimatorobjeto , que asigna la columna especificada en `inputColumnName` a un vector de recuentos de n-gramas en una nueva columna denominada `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Cree un WordBagEstimatorobjeto , que asigna las varias columnas especificadas en `inputColumnNames` a un vector de recuentos de n-gramas en una nueva columna denominada `outputColumnName`.
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	Cree un CustomStopWordsRemovingEstimatorobjeto , que copia los datos de la columna especificada en `inputColumnName` en una nueva columna: `outputColumnName` y quita un conjunto de texto predifined específico para `language` él.
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	Cree un CustomStopWordsRemovingEstimatorobjeto , que copia los datos de la columna especificada en `inputColumnName` en una nueva columna: `outputColumnName` y quita el texto especificado en `stopwords` de ella.
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	Cree un TokenizingByCharactersEstimator, que tokeniza dividiendo el texto en secuencias de caracteres mediante una ventana deslizante.
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	Cree un WordTokenizingEstimator, que tokeniza el texto de entrada mediante `separators` como separadores.

Se aplica a

TextCatalog Clase

Definición

Métodos

Se aplica a

Comentarios

Recursos adicionales