Microsoft.ML.Transforms.Text Espacio de nombres
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Espacio de nombres que contiene componentes de transformación de datos de texto.
Custom |
IEstimator<TTransformer>para .CustomStopWordsRemovingTransformer |
Custom |
Use el eliminador de palabras irrelevantes que puede quitar la lista específica del lenguaje de palabras irrelevantes (palabras más comunes) ya definidas en el sistema. |
Custom |
ITransformer resultante de ajustar un objeto CustomStopWordsRemovingEstimator. |
Latent |
La transformación LDA implementa LightLDA, una implementación de última generación de Latent Dirichlet Allocation. |
Latent |
ITransformer resultante de ajustar un objeto LatentDirichletAllocationEstimator. |
Latent |
Proporcione detalles sobre los temas detectados por LightLDA. |
Ngram |
Genera un vector de recuentos de n-gramas (secuencias de palabras consecutivas) encontrados en el texto de entrada. |
Ngram |
ITransformerresultante de ajustar un .NgramExtractingEstimator |
Ngram |
|
Ngram |
Espacio de nombres que contiene componentes de transformación de datos de texto. |
Stop |
IEstimator<TTransformer>para .CustomStopWordsRemovingTransformer |
Stop |
Use el eliminador de palabras irrelevantes que puede quitar la lista específica del idioma de palabras irrelevantes (palabras más comunes) ya definidas en el sistema. |
Stop |
ITransformer resultante de ajustar un objeto StopWordsRemovingEstimator. |
Text |
Estimador que convierte una colección de documentos de texto en vectores numéricos de características. Los vectores de características son recuentos normalizados de palabras o caracteres n-gramas (según las opciones proporcionadas). |
Text |
Opciones avanzadas para .TextFeaturizingEstimator |
Text |
|
Text |
ITransformer resultante de ajustar un objeto TextNormalizingEstimator. |
Tokenizing |
IEstimator<TTransformer>para .TokenizingByCharactersTransformer |
Tokenizing |
ITransformer resultante de ajustar un objeto TokenizingByCharactersEstimator. |
Word |
|
Word |
Opciones de cómo se extraen los n-gramas. |
Word |
Caracterizador de texto que convierte vectores de tokens de texto en un vector numérico mediante un modelo de incrustaciones previamente entrenadas. |
Word |
ITransformerresultante de ajustar un .WordEmbeddingEstimator |
Word |
|
Word |
Tokeniza el texto de entrada mediante delimitadores especificados. |
Word |
ITransformerresultante de ajustar un .WordTokenizingEstimator |
Latent |
Espacio de nombres que contiene componentes de transformación de datos de texto. |
Latent |
Espacio de nombres que contiene componentes de transformación de datos de texto. |
IStop |
Define el tipo diferente de palabras irrelevantes que se admiten. |
Ngram |
Medida estadística utilizada para evaluar lo importante que es una palabra para un documento en un corpus. Esta enumeración se serializa. |
Stop |
Palabras irrelevantes. Esta enumeración se serializa. |
Text |
Idioma del texto. Esta enumeración se serializa. |
Text |
Tipo de normalizador de vector de texto. |
Text |
Modo de normalización de mayúsculas y minúsculas del texto. Esta enumeración se serializa. |
Word |
Especifica qué palabras se van a usar. |