TextCatalog Clase

Definición

Colección de métodos de extensión para .TransformsCatalog

public static class TextCatalog
type TextCatalog = class
Public Module TextCatalog
Herencia
TextCatalog

Métodos

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Cree un WordEmbeddingEstimator, que es un caracterizador de texto que convierte vectores de texto en vectores numéricos mediante modelos de incrustaciones previamente entrenadas.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

Cree un WordEmbeddingEstimator, que es un caracterizador de texto que convierte un vector de texto en un vector numérico mediante modelos de incrustaciones previamente entrenadas.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Cree un TextFeaturizingEstimator, que transforma una columna de texto en un vector con caracterización de Single que representa recuentos normalizados de n-gramas y char-gramas.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Cree un TextFeaturizingEstimator, que transforma una columna de texto en vector con caracterización de Single que representa recuentos normalizados de n-gramas y char-gramas.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Cree un LatentDirichletAllocationEstimatorobjeto , que usa LightLDA para transformar el texto (representado como vector de floats) en un vector de Single que indique la similitud del texto con cada tema identificado.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

Crea un TextNormalizingEstimator, que normaliza el texto entrante en inputColumnName cambiando opcionalmente mayúsculas y minúsculas, quitando marcas diacríticas, signos de puntuación, números y genera texto nuevo como outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Cree un NgramHashingEstimator, que copia los datos de la columna especificada en inputColumnName en una nueva columna: outputColumnName y genera un vector de recuentos de n-gramas con hash.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Cree un NgramHashingEstimator, que toma los datos de las varias columnas especificadas en inputColumnNames en una nueva columna: outputColumnName y genera un vector de recuentos de n-gramas con hash.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Cree un WordHashBagEstimatorobjeto , que asigna la columna especificada en inputColumnName a un vector de recuentos de n-gramas con hash en una nueva columna denominada outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Cree un WordHashBagEstimator, que asigna las varias columnas especificadas en inputColumnNames a un vector de recuentos de n-gramas con hash en una nueva columna denominada outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crea un objeto NgramExtractingEstimator que genera un vector de recuentos de n-gramas (secuencias de palabras consecutivas) encontrados en el texto de entrada.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Cree un WordBagEstimatorobjeto , que asigna la columna especificada en inputColumnName a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Cree un WordBagEstimatorobjeto , que asigna la columna especificada en inputColumnName a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Cree un WordBagEstimatorobjeto , que asigna las varias columnas especificadas en inputColumnNames a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Cree un CustomStopWordsRemovingEstimatorobjeto , que copia los datos de la columna especificada en inputColumnName en una nueva columna: outputColumnName y quita un conjunto de texto predifined específico para language él.

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Cree un CustomStopWordsRemovingEstimatorobjeto , que copia los datos de la columna especificada en inputColumnName en una nueva columna: outputColumnName y quita el texto especificado en stopwords de ella.

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Cree un TokenizingByCharactersEstimator, que tokeniza dividiendo el texto en secuencias de caracteres mediante una ventana deslizante.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Cree un WordTokenizingEstimator, que tokeniza el texto de entrada mediante separators como separadores.

Se aplica a