Compartir a través de


Microsoft.ML.Transforms.Text Espacio de nombres

Espacio de nombres que contiene componentes de transformación de datos de texto.

Clases

CustomStopWordsRemovingEstimator

IEstimator<TTransformer>para .CustomStopWordsRemovingTransformer

CustomStopWordsRemovingEstimator.Options

Use el eliminador de palabras irrelevantes que puede quitar la lista específica del lenguaje de palabras irrelevantes (palabras más comunes) ya definidas en el sistema.

CustomStopWordsRemovingTransformer

ITransformer resultante de ajustar un objeto CustomStopWordsRemovingEstimator.

LatentDirichletAllocationEstimator

La transformación LDA implementa LightLDA, una implementación de última generación de Latent Dirichlet Allocation.

LatentDirichletAllocationTransformer

ITransformer resultante de ajustar un objeto LatentDirichletAllocationEstimator.

LatentDirichletAllocationTransformer.ModelParameters

Proporcione detalles sobre los temas detectados por LightLDA.

NgramExtractingEstimator

Genera un vector de recuentos de n-gramas (secuencias de palabras consecutivas) encontrados en el texto de entrada.

NgramExtractingTransformer

ITransformerresultante de ajustar un .NgramExtractingEstimator

NgramHashingEstimator

IEstimator<TTransformer>para .NgramHashingTransformer

NgramHashingTransformer

Espacio de nombres que contiene componentes de transformación de datos de texto.

StopWordsRemovingEstimator

IEstimator<TTransformer>para .CustomStopWordsRemovingTransformer

StopWordsRemovingEstimator.Options

Use el eliminador de palabras irrelevantes que puede quitar la lista específica del idioma de palabras irrelevantes (palabras más comunes) ya definidas en el sistema.

StopWordsRemovingTransformer

ITransformer resultante de ajustar un objeto StopWordsRemovingEstimator.

TextFeaturizingEstimator

Estimador que convierte una colección de documentos de texto en vectores numéricos de características. Los vectores de características son recuentos normalizados de palabras o caracteres n-gramas (según las opciones proporcionadas).

TextFeaturizingEstimator.Options

Opciones avanzadas para .TextFeaturizingEstimator

TextNormalizingEstimator

IEstimator<TTransformer>para .TextNormalizingTransformer

TextNormalizingTransformer

ITransformer resultante de ajustar un objeto TextNormalizingEstimator.

TokenizingByCharactersEstimator

IEstimator<TTransformer>para .TokenizingByCharactersTransformer

TokenizingByCharactersTransformer

ITransformer resultante de ajustar un objeto TokenizingByCharactersEstimator.

WordBagEstimator

IEstimator<TTransformer>para .ITransformer

WordBagEstimator.Options

Opciones de cómo se extraen los n-gramas.

WordEmbeddingEstimator

Caracterizador de texto que convierte vectores de tokens de texto en un vector numérico mediante un modelo de incrustaciones previamente entrenadas.

WordEmbeddingTransformer

ITransformerresultante de ajustar un .WordEmbeddingEstimator

WordHashBagEstimator

IEstimator<TTransformer>para .ITransformer

WordTokenizingEstimator

Tokeniza el texto de entrada mediante delimitadores especificados.

WordTokenizingTransformer

ITransformerresultante de ajustar un .WordTokenizingEstimator

Estructuras

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

Espacio de nombres que contiene componentes de transformación de datos de texto.

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

Espacio de nombres que contiene componentes de transformación de datos de texto.

Interfaces

IStopWordsRemoverOptions

Define el tipo diferente de palabras irrelevantes que se admiten.

Enumeraciones

NgramExtractingEstimator.WeightingCriteria

Medida estadística utilizada para evaluar lo importante que es una palabra para un documento en un corpus. Esta enumeración se serializa.

StopWordsRemovingEstimator.Language

Palabras irrelevantes. Esta enumeración se serializa.

TextFeaturizingEstimator.Language

Idioma del texto. Esta enumeración se serializa.

TextFeaturizingEstimator.NormFunction

Tipo de normalizador de vector de texto.

TextNormalizingEstimator.CaseMode

Modo de normalización de mayúsculas y minúsculas del texto. Esta enumeración se serializa.

WordEmbeddingEstimator.PretrainedModelKind

Especifica qué palabras se van a usar.