Partager via


Analyse de texte

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

cet article décrit les modules d’analyse de texte inclus dans Machine Learning Studio (classic). Ces modules fournissent des outils de calcul spécialisés pour travailler avec du texte structuré et non structuré, y compris :

  • Plusieurs options pour le prétraitement du texte.
  • Détection de la langue.
  • Création de fonctionnalités à partir de texte à l’aide de dictionnaires n-Gram personnalisables.
  • Le hachage des fonctionnalités, pour analyser efficacement le texte sans prétraitement ou analyse linguistique avancée.
  • Vowpal Wabbit, pour des Machine Learning très rapides sur du texte. Vowpal Wabbit prend en charge le hachage des fonctionnalités, la modélisation des rubriques (thèmes LDA) et la classification.
  • Reconnaissance d’entité nommée pour extraire du texte non structuré les noms des personnes, des lieux et des organisations.

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Exemples

pour obtenir des exemples d’analyse de texte à l’aide de Machine Learning, consultez la Azure AI Gallery:

Liste des modules

la catégorie Analyse de texte dans Machine Learning Studio (classic) comprend les modules suivants :

  • Détecter les langues: détecte la langue de chaque ligne du fichier d’entrée.
  • Extraire les expressions clés dutexte : extrait les expressions clés du texte donné.
  • Extraire les fonctionnalités n-Gram du texte: crée des fonctionnalités de dictionnaire n-Gram et effectue une sélection des fonctionnalités sur ces dernières.
  • Hachage de fonctionnalité: convertit les données texte en fonctionnalités encodées en entier à l’aide de la bibliothèque vowpal Wabbit.
  • Allocation Dirichlet latente: effectue la modélisation des rubriques à l’aide de la bibliothèque de Wabbit VOWPAL pour thèmes Lda.
  • Reconnaissance d’entité nommée: reconnaît les entités nommées dans une colonne de texte.
  • PreProcess Text: effectue des opérations de nettoyage sur du texte.
  • Score vowpal Wabbit 7-4: score d’entrée à partir d’Azure à l’aide de la version 7-4 du système de machine learning Wabbit vowpal.
  • Score vowpal Wabbit 7-10: score d’entrée à partir d’Azure à l’aide de la version 7-10 du système de machine learning Wabbit vowpal.
  • Score vowpal Wabbit 8 Model: résultats d’entrée à partir d’Azure à l’aide de la version 8 du système de machine learning Wabbit vowpal.
  • Apprentissage d’un modèle vowpal Wabbit 7-4: effectue l’apprentissage d’un modèle à l’aide de la version 7-4 du système de machine learning Wabbit vowpal.
  • Apprentissage d’un modèle vowpal Wabbit 7-10: effectue l’apprentissage d’un modèle à l’aide de la version 7-10 du système de machine learning Wabbit vowpal.
  • Form vowpal Wabbit 8 Model: effectue l’apprentissage d’un modèle à l’aide de la version 8 du système de machine learning Wabbit vowpal.

Voir aussi