TransformsCatalog.TextTransforms Classe

Référence

Définition

Espace de noms:: Microsoft.ML

Assembly:: Microsoft.ML.Data.dll

Paquet:: Microsoft.ML v3.0.1

Paquet:: Microsoft.ML v1.0.0

Paquet:: Microsoft.ML v1.1.0

Paquet:: Microsoft.ML v1.2.0

Paquet:: Microsoft.ML v1.3.1

Paquet:: Microsoft.ML v1.4.0

Paquet:: Microsoft.ML v1.5.5

Paquet:: Microsoft.ML v1.6.0

Paquet:: Microsoft.ML v1.7.0

Paquet:: Microsoft.ML v2.0.0

Important

Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.

Classe utilisée par MLContext pour créer des instances de composants de transformation de données texte.

public sealed class TransformsCatalog.TextTransforms

type TransformsCatalog.TextTransforms = class

Public NotInheritable Class TransformsCatalog.TextTransforms

Héritage: Object
TransformsCatalog.TextTransforms

Méthodes d’extension

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	Créez un WordEmbeddingEstimator, qui est un caractérisation de texte qui convertit un vecteur de texte en vecteur numérique à l’aide de modèles d’incorporations préentraînés.
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	Créez un WordEmbeddingEstimator, qui est un caractérisation de texte qui convertit des vecteurs de texte en vecteurs numériques à l’aide de modèles d’incorporations préentraînés.
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	Créez un TextFeaturizingEstimator, qui transforme une colonne de texte en vecteur de caractérisation de Single qui représente les nombres normalisés de n-grammes et char-grammes.
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	Créez un TextFeaturizingEstimator, qui transforme une colonne de texte en vecteur de caractérisation de Single qui représente le nombre normalisé de n-grammes et de caractères-grammes.
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	Créez un LatentDirichletAllocationEstimator, qui utilise LightLDA pour transformer du texte (représenté sous la forme d’un vecteur de floats) en vecteur indiquant Single la similitude du texte avec chaque rubrique identifiée.
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	Crée un TextNormalizingEstimator, qui normalise le texte entrant dans en `inputColumnName` modifiant éventuellement la casse, en supprimant les marques diacritiques, les signes de ponctuation, les nombres et génère un nouveau texte en tant que `outputColumnName`.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Créez un NgramHashingEstimator, qui copie les données de la colonne spécifiée dans vers `inputColumnName` une nouvelle colonne : `outputColumnName` et produit un vecteur de nombres de n-grammes hachés.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Créez un NgramHashingEstimator, qui prend les données des plusieurs colonnes spécifiées dans vers `inputColumnNames` une nouvelle colonne : `outputColumnName` et produit un vecteur de nombres de n-grammes hachés.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Créez un WordHashBagEstimator, qui mappe la colonne spécifiée dans `inputColumnName` à un vecteur de nombres de n grammes hachés dans une nouvelle colonne nommée `outputColumnName`.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Créez un WordHashBagEstimator, qui mappe les plusieurs colonnes spécifiées dans `inputColumnNames` à un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée `outputColumnName`.
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Crée un NgramExtractingEstimator qui produit un vecteur de nombres de n-grammes (séquences de mots consécutifs) rencontrés dans le texte d’entrée.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	Créez un WordBagEstimator, qui mappe la colonne spécifiée dans `inputColumnName` à un vecteur de nombres de n-grammes dans une nouvelle colonne nommée `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Créez un WordBagEstimator, qui mappe la colonne spécifiée dans `inputColumnName` à un vecteur de nombres de n-grammes dans une nouvelle colonne nommée `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Créez un WordBagEstimator, qui mappe les plusieurs colonnes spécifiées dans `inputColumnNames` à un vecteur de nombres de n grammes dans une nouvelle colonne nommée `outputColumnName`.
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	Créez un CustomStopWordsRemovingEstimator, qui copie les données de la colonne spécifiée dans vers `inputColumnName` une nouvelle colonne : `outputColumnName` et supprime de celui-ci un ensemble prédifiné de texte spécifique à `language` .
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	Créez un CustomStopWordsRemovingEstimator, qui copie les données de la colonne spécifiée dans dans `inputColumnName` vers une nouvelle colonne : `outputColumnName` et supprime du texte spécifié dans `stopwords` de celui-ci.
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	Créez un , qui crée des TokenizingByCharactersEstimatorjetons en divisant le texte en séquences de caractères à l’aide d’une fenêtre glissante.
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	Créez un WordTokenizingEstimator, qui tokenise le texte d’entrée à l’aide `separators` de comme séparateurs.

S’applique à

Partager via

TransformsCatalog.TextTransforms Classe

Définition

Méthodes d’extension

S’applique à

Ressources supplémentaires