Partager via


TextCatalog Classe

Définition

Collection de méthodes d’extension pour .TransformsCatalog

public static class TextCatalog
type TextCatalog = class
Public Module TextCatalog
Héritage
TextCatalog

Méthodes

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Créez un WordEmbeddingEstimator, qui est un générateur de texte qui convertit des vecteurs de texte en vecteurs numériques à l’aide de modèles d’incorporation préentraînés.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

Créez un WordEmbeddingEstimator, qui est un générateur de texte qui convertit un vecteur de texte en vecteur numérique à l’aide de modèles d’incorporation préentraînés.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Créez un TextFeaturizingEstimator, qui transforme une colonne de texte en un vecteur de type featurized de Single qui représente le nombre normalisé de n-grammes et de caractères-grammes.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Créez un TextFeaturizingEstimator, qui transforme une colonne de texte en vecteur featurized de Single qui représente les nombres normalisés de n-grammes et de caractères- grammes.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Créez un LatentDirichletAllocationEstimator, qui utilise LightLDA pour transformer le texte (représenté sous la forme d’un vecteur de floats) en vecteur d’indication de Single la similarité du texte avec chaque rubrique identifiée.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

Crée un TextNormalizingEstimator, qui normalise le texte entrant dans en inputColumnName modifiant éventuellement la casse, en supprimant les marques diacritiques, les marques de ponctuation, les nombres, et génère un nouveau texte sous la forme outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Créez un NgramHashingEstimator, qui copie les données de la colonne spécifiée dans dans vers inputColumnName une nouvelle colonne : outputColumnName et produit un vecteur de nombres de n grammes hachés.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Créez un NgramHashingEstimator, qui prend les données des plusieurs colonnes spécifiées dans dans inputColumnNames vers une nouvelle colonne : outputColumnName et produit un vecteur de nombres de n-grammes hachés.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Créez un WordHashBagEstimator, qui mappe la colonne spécifiée dans inputColumnName à un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Créez un WordHashBagEstimator, qui mappe les plusieurs colonnes spécifiées dans à inputColumnNames un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crée un NgramExtractingEstimator qui produit un vecteur de nombres de n-grammes (séquences de mots consécutifs) rencontrés dans le texte d’entrée.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Créez un WordBagEstimator, qui mappe la colonne spécifiée dans inputColumnName à un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Créez un WordBagEstimator, qui mappe la colonne spécifiée dans inputColumnName à un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Créez un WordBagEstimator, qui mappe les plusieurs colonnes spécifiées dans à inputColumnNames un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Créez un CustomStopWordsRemovingEstimator, qui copie les données de la colonne spécifiée dans inputColumnName une nouvelle colonne : outputColumnName et supprime de celui-ci l’ensemble prédifiné de texte spécifique pour language .

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Créez un CustomStopWordsRemovingEstimator, qui copie les données de la colonne spécifiée dans inputColumnName une nouvelle colonne : outputColumnName et supprime du texte spécifié dans stopwords de celui-ci.

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Créez un TokenizingByCharactersEstimatorobjet , qui effectue des jetons en fractionnant le texte en séquences de caractères à l’aide d’une fenêtre glissante.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Créez un WordTokenizingEstimator, qui tokenise le texte d’entrée en utilisant separators comme séparateurs.

S’applique à