Share via


TransformsCatalog.TextTransforms Classe

Définition

Classe utilisée par MLContext pour créer des instances de composants de transformation de données texte.

public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
Héritage
TransformsCatalog.TextTransforms

Méthodes d’extension

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

Créez un WordEmbeddingEstimator, qui est un caractérisation de texte qui convertit un vecteur de texte en vecteur numérique à l’aide de modèles d’incorporations préentraînés.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Créez un WordEmbeddingEstimator, qui est un caractérisation de texte qui convertit des vecteurs de texte en vecteurs numériques à l’aide de modèles d’incorporations préentraînés.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Créez un TextFeaturizingEstimator, qui transforme une colonne de texte en vecteur de caractérisation de Single qui représente les nombres normalisés de n-grammes et char-grammes.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Créez un TextFeaturizingEstimator, qui transforme une colonne de texte en vecteur de caractérisation de Single qui représente le nombre normalisé de n-grammes et de caractères-grammes.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Créez un LatentDirichletAllocationEstimator, qui utilise LightLDA pour transformer du texte (représenté sous la forme d’un vecteur de floats) en vecteur indiquant Single la similitude du texte avec chaque rubrique identifiée.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

Crée un TextNormalizingEstimator, qui normalise le texte entrant dans en inputColumnName modifiant éventuellement la casse, en supprimant les marques diacritiques, les signes de ponctuation, les nombres et génère un nouveau texte en tant que outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Créez un NgramHashingEstimator, qui copie les données de la colonne spécifiée dans vers inputColumnName une nouvelle colonne : outputColumnName et produit un vecteur de nombres de n-grammes hachés.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Créez un NgramHashingEstimator, qui prend les données des plusieurs colonnes spécifiées dans vers inputColumnNames une nouvelle colonne : outputColumnName et produit un vecteur de nombres de n-grammes hachés.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Créez un WordHashBagEstimator, qui mappe la colonne spécifiée dans inputColumnName à un vecteur de nombres de n grammes hachés dans une nouvelle colonne nommée outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Créez un WordHashBagEstimator, qui mappe les plusieurs colonnes spécifiées dans inputColumnNames à un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crée un NgramExtractingEstimator qui produit un vecteur de nombres de n-grammes (séquences de mots consécutifs) rencontrés dans le texte d’entrée.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Créez un WordBagEstimator, qui mappe la colonne spécifiée dans inputColumnName à un vecteur de nombres de n-grammes dans une nouvelle colonne nommée outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Créez un WordBagEstimator, qui mappe la colonne spécifiée dans inputColumnName à un vecteur de nombres de n-grammes dans une nouvelle colonne nommée outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Créez un WordBagEstimator, qui mappe les plusieurs colonnes spécifiées dans inputColumnNames à un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Créez un CustomStopWordsRemovingEstimator, qui copie les données de la colonne spécifiée dans vers inputColumnName une nouvelle colonne : outputColumnName et supprime de celui-ci un ensemble prédifiné de texte spécifique à language .

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Créez un CustomStopWordsRemovingEstimator, qui copie les données de la colonne spécifiée dans dans inputColumnName vers une nouvelle colonne : outputColumnName et supprime du texte spécifié dans stopwords de celui-ci.

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Créez un , qui crée des TokenizingByCharactersEstimatorjetons en divisant le texte en séquences de caractères à l’aide d’une fenêtre glissante.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Créez un WordTokenizingEstimator, qui tokenise le texte d’entrée à l’aide separators de comme séparateurs.

S’applique à