TextCatalog Classe

Référence

Définition

Espace de noms:: Microsoft.ML

Assembly:: Microsoft.ML.Transforms.dll

Paquet:: Microsoft.ML v3.0.1

Paquet:: Microsoft.ML v1.0.0

Paquet:: Microsoft.ML v1.1.0

Paquet:: Microsoft.ML v1.2.0

Paquet:: Microsoft.ML v1.3.1

Paquet:: Microsoft.ML v1.4.0

Paquet:: Microsoft.ML v1.5.5

Paquet:: Microsoft.ML v1.6.0

Paquet:: Microsoft.ML v1.7.0

Paquet:: Microsoft.ML v2.0.0

Important

Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.

Collection de méthodes d’extension pour .TransformsCatalog

public static class TextCatalog

type TextCatalog = class

Public Module TextCatalog

Héritage: Object
TextCatalog

Méthodes

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	Créez un WordEmbeddingEstimator, qui est un générateur de texte qui convertit des vecteurs de texte en vecteurs numériques à l’aide de modèles d’incorporation préentraînés.
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	Créez un WordEmbeddingEstimator, qui est un générateur de texte qui convertit un vecteur de texte en vecteur numérique à l’aide de modèles d’incorporation préentraînés.
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	Créez un TextFeaturizingEstimator, qui transforme une colonne de texte en un vecteur de type featurized de Single qui représente le nombre normalisé de n-grammes et de caractères-grammes.
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	Créez un TextFeaturizingEstimator, qui transforme une colonne de texte en vecteur featurized de Single qui représente les nombres normalisés de n-grammes et de caractères- grammes.
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	Créez un LatentDirichletAllocationEstimator, qui utilise LightLDA pour transformer le texte (représenté sous la forme d’un vecteur de floats) en vecteur d’indication de Single la similarité du texte avec chaque rubrique identifiée.
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	Crée un TextNormalizingEstimator, qui normalise le texte entrant dans en `inputColumnName` modifiant éventuellement la casse, en supprimant les marques diacritiques, les marques de ponctuation, les nombres, et génère un nouveau texte sous la forme `outputColumnName`.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Créez un NgramHashingEstimator, qui copie les données de la colonne spécifiée dans dans vers `inputColumnName` une nouvelle colonne : `outputColumnName` et produit un vecteur de nombres de n grammes hachés.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Créez un NgramHashingEstimator, qui prend les données des plusieurs colonnes spécifiées dans dans `inputColumnNames` vers une nouvelle colonne : `outputColumnName` et produit un vecteur de nombres de n-grammes hachés.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Créez un WordHashBagEstimator, qui mappe la colonne spécifiée dans `inputColumnName` à un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée `outputColumnName`.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Créez un WordHashBagEstimator, qui mappe les plusieurs colonnes spécifiées dans à `inputColumnNames` un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée `outputColumnName`.
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Crée un NgramExtractingEstimator qui produit un vecteur de nombres de n-grammes (séquences de mots consécutifs) rencontrés dans le texte d’entrée.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	Créez un WordBagEstimator, qui mappe la colonne spécifiée dans `inputColumnName` à un vecteur de nombres de n grammes dans une nouvelle colonne nommée `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Créez un WordBagEstimator, qui mappe la colonne spécifiée dans `inputColumnName` à un vecteur de nombres de n grammes dans une nouvelle colonne nommée `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Créez un WordBagEstimator, qui mappe les plusieurs colonnes spécifiées dans à `inputColumnNames` un vecteur de nombres de n grammes dans une nouvelle colonne nommée `outputColumnName`.
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	Créez un CustomStopWordsRemovingEstimator, qui copie les données de la colonne spécifiée dans `inputColumnName` une nouvelle colonne : `outputColumnName` et supprime de celui-ci l’ensemble prédifiné de texte spécifique pour `language` .
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	Créez un CustomStopWordsRemovingEstimator, qui copie les données de la colonne spécifiée dans `inputColumnName` une nouvelle colonne : `outputColumnName` et supprime du texte spécifié dans `stopwords` de celui-ci.
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	Créez un TokenizingByCharactersEstimatorobjet , qui effectue des jetons en fractionnant le texte en séquences de caractères à l’aide d’une fenêtre glissante.
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	Créez un WordTokenizingEstimator, qui tokenise le texte d’entrée en utilisant `separators` comme séparateurs.

S’applique à

Share via

TextCatalog Classe

Définition

Méthodes

S’applique à

Commentaires

Ressources supplémentaires