Qu’est-ce que la classification de texte personnalisée ?

Article
12/19/2023

La classification de texte personnalisée est une des fonctionnalités personnalisées offertes par Azure AI Langage. Il s’agit d’un service d’API basé sur le cloud qui applique l’intelligence du machine learning à la création de modèles personnalisés pour les tâches de classification de texte.

La classification de texte personnalisée permet à ses utilisateurs de créer des modèles IA personnalisés pour classer du texte dans des classes personnalisées prédéfinies par l’utilisateur. Un projet de classification de texte personnalisée permet aux développeurs d’étiqueter les données, et d’entraîner, évaluer et améliorer les performances du modèle de façon itérative, avant de le rendre disponible pour la consommation. La qualité des données étiquetées impacte considérablement les performances du modèle. Pour simplifier la création et la personnalisation de votre modèle, le service offre un portail web personnalisé accessible dans Langage Studio. Vous pouvez facilement commencer à utiliser le service en suivant les étapes de ce guide de démarrage rapide.

La classification de texte personnalisée prend en charge deux types de projets :

Classification avec une seule étiquette : vous pouvez attribuer une seule classe à chaque document de votre jeu de données. Par exemple, un script de film peut uniquement être classé comme « Romance » ou « Comedy ».
Classification avec plusieurs étiquettes : vous pouvez attribuer plusieurs classes à chaque document de votre jeu de données. Par exemple, un script de film peut être classé comme « Comedy » ou « Romance » et « Comedy ».

Cette documentation contient les types d’articles suivants :

Les Démarrages rapides sont des instructions de prise en main qui vous guident dans la formulation de vos requêtes au service.
Des concepts fournissent des explications sur les fonctionnalités du service.
Les Guides pratiques contiennent des instructions sur l’utilisation du service de manière plus spécifique ou personnalisée.

Exemples de scénarios d’utilisation

La classification de texte personnalisée peut être utilisée dans plusieurs scénarios dans divers secteurs d’activité :

Triage automatique des e-mails ou tickets

Les centres de support de tous types reçoivent un volume élevé d'e-mails ou de tickets contenant du texte non structuré, de forme libre et des pièces jointes. Le délai de lecture de ces e-mails, d’accusé de réception et de routage vers les experts des équipes internes est crucial. Le triage des e-mails à cette échelle implique que des personnes les lisent et les renvoient aux bons services, ce qui prend du temps et des ressources. La classification de texte personnalisée peut permettre d’analyser le triage du texte entrant et de catégoriser le contenu pour qu’il soit automatiquement routé vers le service approprié qui prendra des mesures supplémentaires.

Exploration des connaissances pour améliorer/enrichir la recherche sémantique

La recherche est fondamentale pour toute application qui présente du contenu textuel aux utilisateurs. Les scénarios courants incluent les recherches dans des catalogues ou des documents, les recherches de produits de vente au détail ou l’exploration de connaissances pour la science des données. De nombreuses entreprises issues de divers secteurs cherchent à créer une expérience de recherche enrichie à partir d’un contenu privé hétérogène comprenant à la fois des documents structurés et des documents non structurés. Dans le cadre de leur pipeline, les développeurs peuvent utiliser la classification de texte personnalisée afin de catégoriser leur texte en classes pertinentes pour leur secteur d’activité. Les classes prédites peuvent être utilisées pour enrichir l’indexation du fichier afin d’obtenir une expérience de recherche plus personnalisée.

Cycle de vie du développement de projet

La création d’un projet de classification de texte personnalisée implique généralement différentes étapes.

Suivez ces étapes pour tirer le meilleur parti de votre modèle :

Définir votre schéma : comprenez vos données et identifiez les différentes classes qui vous intéressent afin d’éviter toute ambiguïté.
Étiqueter vos données : la qualité de l’étiquetage des données est un facteur clé dans la détermination des performances du modèle. Les documents qui appartiennent à la même classe doivent toujours avoir la même classe. Si vous avez un document qui peut appartenir à deux classes, utilisez des projets de classification en plusieurs étiquettes. Évitez l’ambiguïté de classe, veillez à ce que vos classes soient clairement dissociées les unes des autres, en particulier pour les projets d’étiquetage avec une seule classe.
Entraîner le modèle : votre modèle commence à apprendre à partir de vos données étiquetées.
Voir les performances du modèle : consultez les détails de l’évaluation de votre modèle pour déterminer ses performances quand de nouvelles données lui sont présentées.
Déployer le modèle : le déploiement d’un modèle permet de l’utiliser avec l’API Analyse.
Classer le texte : utilisez votre modèle personnalisé pour les tâches de classification de texte personnalisée.

Documentation de référence et exemples de code

Quand vous utilisez la classification de texte personnalisée, veuillez consulter la documentation de référence et les exemples suivants pour Azure AI Language :

Option de développement/langage	Documentation de référence	Exemples
API REST (création)	Documentation des API REST
API REST (runtime)	Documentation des API REST
C# (Runtime)	Documentation C#	Exemples C# - Classification avec une seule étiquette Exemples C# - Classification avec plusieurs étiquettes
Java (Runtime)	Documentation Java	Exemples Java - Classification avec une seule étiquette Exemples Java - Classification avec plusieurs étiquettes
JavaScript (Runtime)	Documentation JavaScript	Exemples JavaScript - Classification avec une seule étiquette Exemples JavaScript - Classification avec plusieurs étiquettes
Python (Runtime)	Documentation Python	Exemples Python - Classification avec une seule étiquette Exemples Python - Classification avec plusieurs étiquettes

Intelligence artificielle responsable

Un système IA comprend non seulement la technologie, mais aussi les personnes qui l’utiliseront, les personnes qui seront affectées par lui et l’environnement dans lequel il est déployé. Lisez la note de transparence pour la classification de texte personnalisée pour en savoir plus sur l’utilisation et le déploiement d’une IA responsable dans vos systèmes. Vous pouvez également consulter les articles suivants pour plus d’informations :

Étapes suivantes

Utilisez le guide de démarrage rapide pour commencer à utiliser la classification de texte personnalisée.
Au fur et à mesure que vous parcourez le cycle de vie du développement de projet, consultez le glossaire afin d’en savoir plus sur les termes utilisés dans la documentation pour cette fonctionnalité.
N’oubliez pas de consulter les limites du service pour obtenir des informations telles que la disponibilité régionale.