Partage via


Démarrage rapide : résumé personnalisé (préversion)

Utilisez cet article pour commencer à créer un projet de résumé personnalisé dans lequel vous pouvez effectuer l’apprentissage de modèles personnalisés en plus de faire des résumés. Un modèle est un logiciel d’intelligence artificielle qui est entraîné pour effectuer une tâche donnée. Pour ce système, les modèles résument du texte et sont entraînés à partir de données importées.

Dans cet article, nous utilisons Language Studio pour expliquer les concepts clés des résumés personnalisés. À titre d’exemple, nous allons créer un modèle de résumé personnalisé afin d’extraire l’établissement ou l’emplacement de traitement à partir de notes de sortie courtes.

Prérequis

Créer une ressource Azure AI Language et un compte de stockage Azure

Avant de pouvoir utiliser un Résumé personnalisé, vous devez créer une ressource Azure AI Language qui vous permettra de disposer des informations d’identification dont vous avez besoin pour créer un projet et commencer à entraîner un modèle. Vous aurez également besoin d’un compte de stockage Azure, où vous pourrez charger le jeu de données à utiliser pour générer votre modèle.

Important

Pour démarrer rapidement, nous vous recommandons de créer une nouvelle ressource Azure AI Language en suivant les étapes indiquées dans cet article. En suivant les étapes dans cet article, vous pourrez créer la ressource Language et le compte de stockage simultanément, ce qui s’avère être plus simple que si vous le faisiez ultérieurement.

Créer une ressource à partir du portail Azure

  1. Accédez au Portail Azure pour créer une ressource Azure AI Language.

  2. Sélectionnez ce service depuis les fonctionnalités personnalisées dans la fenêtre qui apparaît. Sélectionnez Continuer pour créer votre ressource en bas de l’écran.

    Capture d’écran montrant la classification de texte personnalisée et la reconnaissance d'entités nommées personnalisées dans le Portail Azure.

  3. Créez une ressource de langue avec les détails suivants.

    Nom Description
    Abonnement Votre abonnement Azure.
    Resource group Un groupe de ressources comprenant votre ressource. Vous pouvez utiliser un groupe de resources existant ou en créer un.
    Région Région de votre ressource de langue. Par exemple, « USA Ouest 2 ».
    Nom Nom de votre ressource.
    Niveau tarifaire Niveau tarifaire de votre ressource de langue. Vous pouvez utiliser le niveau tarifaire gratuit (F0) pour tester le service.

    Notes

    Si vous recevez un message indiquant « votre compte de connexion n’est pas propriétaire du groupe de ressources du compte de stockage sélectionné », votre compte doit avoir un rôle de propriétaire affecté sur le groupe de ressources avant de pouvoir créer une ressource Language. Pour obtenir de l’aide, contactez le propriétaire de votre abonnement Azure.

  4. Dans la section de ce service, sélectionnez un compte de stockage existant ou un nouveau compte de stockage. Ces valeurs vous aident pour un démarrage rapide. Il ne s’agit pas des valeurs du compte de stockage à utiliser dans les environnements de production. Pour éviter la latence lors de la création de votre projet, connectez-vous à des comptes de stockage dans la même région que votre ressource de langue.

    Valeur du compte de stockage Valeur recommandée
    Nom du compte de stockage Nom quelconque
    Type de compte de stockage LRS standard
  5. Vérifiez que l’Avis d’IA responsable est coché. Au bas de la page, sélectionnez Vérifier + créer, puis Créer.

Télécharger l'exemple de données

Si vous avez besoin d’exemples de données, nous avons fourni des exemples de données pour synthèse de texte et scénarios de synthèse de conversation à des fins de démarrage rapide.

Charger les exemples de données dans un conteneur d’objets blob

  1. Retrouvez les fichiers à charger sur votre compte de stockage

  2. Dans le Portail Azure, accédez au compte de stockage que vous avez créé et sélectionnez-le.

  3. Dans votre compte de stockage, sélectionnez Conteneurs dans le menu de gauche, situé sous Stockage de données. Dans l’écran qui s’affiche, sélectionnez + Conteneur. Donnez au conteneur le nom exemple de données et laissez le Niveau d’accès public par défaut.

    Capture d’écran montrant la page principale d’un compte de stockage.

  4. Une fois votre conteneur créé, sélectionnez-le. Sélectionnez ensuite le bouton Charger pour sélectionner les fichiers .txt et .json que vous avez téléchargés précédemment.

    Capture d’écran montrant le montant de chargement des fichiers vers le compte de stockage.

Créez un projet de résumé personnalisé

Une fois votre ressource et votre compte de stockage configurés, créez un nouveau projet de résumé personnalisé. Un projet est une zone de travail qui vous permet de créer des modèles ML personnalisés en fonction de vos données. Seuls les utilisateurs qui disposent d’un accès à la ressource de langue utilisée peuvent accéder à votre projet.

  1. Connectez-vous à Language Studio. Une fenêtre apparaît pour vous permettre de sélectionner votre abonnement et votre ressource Language. Sélectionnez la ressource de langue que vous avez créée à l’étape ci-dessus.

  2. Sélectionnez la fonctionnalité que vous souhaitez utiliser dans Language Studio.

  3. Sélectionnez Créer un projet dans le menu supérieur de la page des projets. La création d’un projet vous permet d’étiqueter les données, et d’entraîner, évaluer, améliorer et déployer vos modèles.

    Capture d’écran de la page de création de projet.

  4. Entrez les informations relatives au projet, notamment son nom, sa description et la langue des fichiers qu’il contient. Si vous utilisez l’exemple de jeu de données, sélectionnez Anglais. Vous ne pouvez pas changer ultérieurement le nom de votre projet. Sélectionnez Suivant.

    Conseil

    Votre jeu de données n’a pas besoin d’être entièrement dans la même langue. Vous pouvez avoir plusieurs fichiers comportant des langues prises en charge différentes. Si votre jeu de données contient des documents en différentes langues ou si vous prévoyez des textes en d’autres langues au moment de l’exécution, sélectionnez l’option Activer un jeu de données multilingue quand vous entrez les informations de base de votre projet. Cette option peut être activée ultérieurement dans la page des Paramètres du projet.

  5. Une fois que vous avez sélectionné Créer un projet, une fenêtre apparaît pour vous permettre de connecter votre compte de stockage. Si vous avez déjà connecté un compte de stockage, celui-ci s’affiche. Si ce n’est pas le cas, choisissez votre compte de stockage dans la liste déroulante qui s’affiche, puis sélectionnez Connecter le compte de stockage. Cette opération définit les rôles nécessaires pour votre compte de stockage. Cette étape peut retourner une erreur si le rôle propriétaire ne vous est pas attribué sur le compte de stockage.

    Notes

    • Vous ne devez effectuer cette étape qu’une seule fois pour chaque nouvelle ressource utilisée.
    • Ce processus est irréversible. Si vous connectez un compte de stockage à votre ressource de langue, il n’est pas possible de le déconnecter ultérieurement.
    • Vous pouvez connecter votre ressource de langue à un seul compte de stockage.
  6. Sélectionnez le conteneur dans lequel vous avez chargé votre jeu de données.

  7. Si vous avez déjà étiqueté les données, vérifiez qu’elles respectent le format pris en charge, puis sélectionnez Oui, mes fichiers comportent déjà des étiquettes et j’ai mis en forme le fichier d’étiquettes JSON. Sélectionnez ensuite le fichier d’étiquettes dans le menu déroulant. Sélectionnez Suivant. Si vous utilisez le jeu de données du guide de démarrage rapide, il n’est pas nécessaire de passer en revue la mise en forme du fichier d’étiquettes JSON.

  8. Passez en revue les données entrées, puis sélectionnez Créer un projet.

Entraîner votre modèle

Une fois le projet créé, vous pouvez commencer à entraîner votre modèle.

Pour commencer à effectuer l’apprentissage de votre modèle à partir de Language Studio :

  1. Dans le menu de gauche, sélectionnez Travaux d’entraînement.

  2. Sélectionnez Démarrer un travail de formation dans le menu supérieur.

  3. Sélectionnez Effectuer l’apprentissage d’un nouveau modèle, puis tapez le nom du modèle dans la zone de texte. Vous pouvez également remplacer un modèle existant en sélectionnant cette option et le modèle de votre choix dans le menu déroulant. La remplacement d’un modèle entraîné est irréversible. Toutefois, cela n’affecte pas vos modèles déployés tant que vous ne déployez pas le nouveau modèle.

    Créer un nouveau travail de formation

  4. Le système fractionne par défaut vos données étiquetées entre des ensembles d’entraînement et de test, selon des pourcentages spécifiés. Si vous avez des documents dans votre ensemble de test, vous pouvez fractionner manuellement les données d’entraînement et de test.

  5. Sélectionner le bouton Train (Entraîner).

  6. Si vous sélectionnez l’ID du travail d’apprentissage dans la liste, un volet latéral vous permet de vérifier la progression de la formation, l’état du travail et d’autres détails pour ce travail.

    Notes

    • Seuls les emplois de formation achevés avec succès génèrent des modèles.
    • L’apprentissage peut durer de quelques minutes à plusieurs heures en fonction de la taille de vos données étiquetées.
    • Vous ne pouvez avoir qu’un seul travail d’entraînement en cours d’exécution à la fois. Vous ne pouvez pas démarrer un autre travail d’apprentissage dans le même projet tant que le travail en cours d’exécution n’est pas terminé.

Déployer votre modèle

En règle générale, après avoir entraîné un modèle, vous passez en revue les détails de son évaluation et apportez si nécessaire des améliorations. Dans ce guide de démarrage rapide, vous allez simplement déployer votre modèle et le rendre disponible à des fins d’essai dans Language Studio.

Pour déployer votre modèle à partir de Language Studio :

  1. Dans le menu de gauche, sélectionnez Déploiement d’un modèle.

  2. Sélectionnez Ajouter un déploiement pour démarrer un nouveau travail de déploiement.

    Capture d’écran montrant le bouton de déploiement

  3. Sélectionnez Créer un déploiement pour créer un déploiement et attribuer un modèle entraîné dans la liste déroulante ci-dessous. Vous pouvez également Remplacer un déploiement existant en sélectionnant cette option et en sélectionnant le modèle entraîné que vous souhaitez attribuer dans la liste déroulante ci-dessous.

    Notes

    Le remplacement d’un déploiement existant ne nécessite pas de modifier votre appel de l’API de prédiction. Toutefois, les résultats obtenus sont basés sur le modèle qui vient d’être attribué.

    Capture d’écran montrant l’écran de déploiement

  4. Sélectionnez Déployer pour démarrer le travail de déploiement.

  5. Une fois le déploiement réussi, une date d’expiration s’affiche à côté de celui-ci. L’expiration du déploiement correspond au moment où votre modèle déployé n’est plus disponible pour la prédiction. Cela se produit généralement douze mois après l’expiration d’une configuration de l’apprentissage.

Tester votre modèle

Pour ce guide de démarrage rapide, vous utilisez Language Studio pour envoyer la tâche de résumé personnalisé et visualiser les résultats. Dans l’exemple de jeu de données que vous avez téléchargé précédemment, vous trouvez des documents de test que vous pouvez utiliser à cette étape.

Pour tester vos modèles déployés à partir de Language Studio :

  1. Sélectionnez Test des déploiements dans le menu de gauche.

  2. Sélectionnez le déploiement à tester. Vous pouvez uniquement tester les modèles qui sont attribués aux déploiements.

  3. Pour les projets multilingues, dans la liste déroulante de langue, sélectionnez la langue du texte que vous testez.

  4. Sélectionnez le déploiement à interroger/tester dans la liste déroulante.

  5. Vous pouvez entrer le texte que vous souhaitez envoyer à la demande ou charger un fichier .txt à utiliser.

  6. Sélectionnez Exécuter le test dans le menu supérieur.

  7. Sous l’onglet Résultat, vous pouvez voir les entités extraites à partir de votre texte, et leurs types. Vous pouvez également voir la réponse JSON sous l’onglet JSON.

Capture d’écran montrant les résultats de test du modèle.

Nettoyer les ressources

Une fois que vous n’avez plus besoin de votre projet, vous pouvez le supprimer à l’aide de Language Studio. Sélectionnez dans la partie supérieure la fonctionnalité que vous utilisez, puis sélectionnez le projet que vous souhaitez supprimer. Sélectionnez Supprimer dans le menu supérieur pour supprimer le projet.

Étapes suivantes