microsoftml.n_gram : convertit un texte en caractéristiques en utilisant des n-grammes
Usage
microsoftml.n_gram(ngram_length: numbers.Real = 1,
skip_length: numbers.Real = 0, all_lengths: bool = True,
max_num_terms: list = [10000000], weighting: str = 'Tf')
Description
Extrait des n-grammes du texte et les convertit en vecteur à l’aide d’un dictionnaire.
Arguments
ngram_length
Longueur de n-gramme (paramètres).
skip_length
Nombre maximal de jetons à ignorer lors de la construction d’un n-gramme (paramètres).
all_lengths
Indique s’il faut inclure toutes les longueurs de n-gramme jusqu’à NgramLength ou uniquement NgramLength (paramètres).
max_num_terms
Nombre maximal de n-grammes à stocker dans le dictionnaire (paramètres).
weighting
Critères de pondération (paramètres).
Voir aussi
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour