Partage via


Entraîner votre modèle de flux de travail d’orchestration

L’apprentissage est le processus par lequel le modèle apprend à partir de vos énoncés étiquetés. Une fois l’apprentissage effectué, vous pouvez afficher les performances du modèle.

Pour effectuer l’apprentissage d’un modèle, démarrez un travail d’apprentissage. Seuls les travaux terminés avec succès créent un modèle. Un travail d’apprentissage expire au bout de sept jours. Passé ce délai, il est impossible de récupérer les détails de ce travail. Si votre travail d’apprentissage s’est terminé avec succès et qu’un modèle a été créé, il ne sera pas affecté par l’expiration du travail. Vous ne pouvez exécuter qu’un seul travail d’apprentissage à la fois. Vous ne pouvez pas non plus lancer d’autres travaux au sein du même projet.

Les durées de formation peuvent être comprises entre quelques secondes, pour des projets simples, et quelques heures, lorsque vous atteignez la limite maximale des énoncés.

L’évaluation du modèle est déclenchée automatiquement une fois l’entraînement effectué. Le processus d’évaluation commence par utiliser le modèle formé pour exécuter des prédictions sur les énoncés du jeu de tests et compare les résultats prédits avec les étiquettes fournies (qui établit une base de référence de vérité). Les résultats sont renvoyés pour vous permettre d’examiner les performances du modèle.

Prérequis

  • Un projet créé correctement avec un compte de stockage Blob Azure configuré

Pour plus d’informations, consultez Cycle de vie de développement de projet.

Fractionnement des données

Avant d’entamer le processus d’apprentissage, les énoncés étiquetés de votre projet sont divisés en deux jeux : un jeu d’apprentissage et un jeu de test. Chacun d’eux a une fonction différente. Le jeu d’apprentissage est utilisé dans l’apprentissage du modèle. Il s’agit de l’ensemble à partir duquel le modèle apprend les énoncés étiquetés. Le jeu de test est un jeu témoin qui n’est pas présenté au modèle pendant l’apprentissage, mais uniquement lors de l’évaluation.

Après l’apprentissage du modèle, il est utilisé pour effectuer des prédictions à partir des énoncés du jeu de tests. Ces prédictions sont utilisées pour calculer les métriques d’évaluation.

Nous vous recommandons de vérifier que toutes vos intentions sont correctement représentées dans les jeux d’apprentissage et de test.

Le flux de travail de l’ochestration prend en charge deux méthodes pour le fractionnement des données :

  • Fractionnement automatique du jeu de test à partir des données d’apprentissage : le système fractionne les données étiquetées en un jeu d’apprentissage et un jeu de test, selon les pourcentages que vous avez choisis. Le pourcentage recommandé pour le fractionnement est de 80 % pour l’apprentissage et de 20 % pour les tests.

Notes

Si vous choisissez l’option Fractionnement automatique du jeu de test à partir des données d’apprentissage, seules les données attribuées au jeu d’apprentissage sont fractionnées selon les pourcentages fournis.

  • Utiliser un fractionnement manuel des données d’apprentissage et de test : cette méthode permet aux utilisateurs de définir quels énoncés doivent appartenir à quel jeu. Cette étape est activée uniquement si vous avez ajouté des énoncés à votre jeu de test lors de l’étiquetage.

Notes

Vous ne pouvez ajouter que des énoncés dans le jeu de données d’entraînement pour les intentions non connectées uniquement.

Effectuer l'apprentissage du modèle

Démarrer le travail d’apprentissage

Pour commencer à effectuer l’apprentissage de votre modèle à partir de Language Studio :

  1. Dans le menu de gauche, sélectionnez Travaux d’entraînement.

  2. Sélectionnez Démarrer un travail de formation dans le menu supérieur.

  3. Sélectionnez Effectuer l’apprentissage d’un nouveau modèle, puis tapez le nom du modèle dans la zone de texte. Vous pouvez également remplacer un modèle existant en sélectionnant cette option et le modèle de votre choix dans le menu déroulant. La remplacement d’un modèle entraîné est irréversible. Toutefois, cela n’affecte pas vos modèles déployés tant que vous ne déployez pas le nouveau modèle.

    Si vous avez autorisé votre projet à fractionner manuellement vos données pendant l’étiquetage de vos énoncés, deux options de fractionnement des données s’offrent à vous :

    • Fractionnement automatique du jeu de test à partir des données d’entraînement : vos énoncés étiquetés sont fractionnés de façon aléatoire en jeux d’entraînement et de test, selon les pourcentages que vous avez choisis. Le pourcentage par défaut est de 80 % pour l’entraînement et de 20 % pour les tests. Pour changer ces valeurs, choisissez le jeu que vous voulez changer et tapez la nouvelle valeur.

    Notes

    Si vous choisissez l’option Fractionnement automatique du jeu de test à partir des données d’entraînement, seuls les énoncés présents dans votre jeu d’entraînement sont fractionnés selon les pourcentages indiqués.

    • Utiliser un fractionnement manuel des données d’entraînement et de test : affectez chaque énoncé au jeu d’entraînement ou de test à l’étape d’étiquetage du projet.

    Notes

    L’option Utiliser un fractionnement manuel des données d’entraînement et de test est activée uniquement si vous ajoutez des énoncés au jeu de test dans la page d’étiquetage des données. Sinon, elle sera désactivée.

    Capture d’écran montrant la page Effectuer l’apprentissage du modèle pour les projets CLU.

  4. Sélectionner le bouton Train (Entraîner).

Notes

  • Seuls les emplois de formation achevés avec succès génèrent des modèles.
  • L’entraînement peut durer de quelques minutes à quelques heures en fonction de la taille de vos données étiquetées.
  • Vous ne pouvez avoir qu’un seul travail d’entraînement en cours d’exécution à la fois. Vous ne pouvez pas démarrer un autre travail d’apprentissage dans le même projet tant que le travail en cours d’exécution n’est pas terminé.

Obtenir l’état des travaux d’apprentissage

Sélectionnez l’ID du travail d’apprentissage dans la liste, un volet latéral apparaîtra où vous pourrez vérifier la Progression de l’apprentissage, l’État du travail et d’autres détails pour ce travail.

Annuler un travail d’apprentissage

Pour annuler un travail d’apprentissage dans Language Studio, accédez à la page Effectuer l’apprentissage du modèle. Sélectionnez le travail d’apprentissage à annuler, puis sélectionnez Annuler dans le menu supérieur.

Étapes suivantes