Démarrage rapide : résumé personnalisé (préversion)
Utilisez cet article pour commencer à créer un projet de résumé personnalisé dans lequel vous pouvez effectuer l’apprentissage de modèles personnalisés en plus de faire des résumés. Un modèle est un logiciel d’intelligence artificielle qui est entraîné pour effectuer une tâche donnée. Pour ce système, les modèles résument du texte et sont entraînés à partir de données importées.
Dans cet article, nous utilisons Language Studio pour expliquer les concepts clés des résumés personnalisés. À titre d’exemple, nous allons créer un modèle de résumé personnalisé afin d’extraire l’établissement ou l’emplacement de traitement à partir de notes de sortie courtes.
Prérequis
- Abonnement Azure - En créer un gratuitement
Créer une ressource Azure AI Language et un compte de stockage Azure
Avant de pouvoir utiliser un Résumé personnalisé, vous devez créer une ressource Azure AI Language qui vous permettra de disposer des informations d’identification dont vous avez besoin pour créer un projet et commencer à entraîner un modèle. Vous aurez également besoin d’un compte de stockage Azure, où vous pourrez charger le jeu de données à utiliser pour générer votre modèle.
Important
Pour démarrer rapidement, nous vous recommandons de créer une nouvelle ressource Azure AI Language en suivant les étapes indiquées dans cet article. En suivant les étapes dans cet article, vous pourrez créer la ressource Language et le compte de stockage simultanément, ce qui s’avère être plus simple que si vous le faisiez ultérieurement.
Créer une ressource à partir du portail Azure
Accédez au Portail Azure pour créer une ressource Azure AI Language.
Sélectionnez ce service depuis les fonctionnalités personnalisées dans la fenêtre qui apparaît. Sélectionnez Continuer pour créer votre ressource en bas de l’écran.
Créez une ressource de langue avec les détails suivants.
Nom Description Abonnement Votre abonnement Azure. Resource group Un groupe de ressources comprenant votre ressource. Vous pouvez utiliser un groupe de resources existant ou en créer un. Région Région de votre ressource de langue. Par exemple, « USA Ouest 2 ». Nom Nom de votre ressource. Niveau tarifaire Niveau tarifaire de votre ressource de langue. Vous pouvez utiliser le niveau tarifaire gratuit (F0) pour tester le service. Notes
Si vous recevez un message indiquant « votre compte de connexion n’est pas propriétaire du groupe de ressources du compte de stockage sélectionné », votre compte doit avoir un rôle de propriétaire affecté sur le groupe de ressources avant de pouvoir créer une ressource Language. Pour obtenir de l’aide, contactez le propriétaire de votre abonnement Azure.
Dans la section de ce service, sélectionnez un compte de stockage existant ou un nouveau compte de stockage. Ces valeurs vous aident pour un démarrage rapide. Il ne s’agit pas des valeurs du compte de stockage à utiliser dans les environnements de production. Pour éviter la latence lors de la création de votre projet, connectez-vous à des comptes de stockage dans la même région que votre ressource de langue.
Valeur du compte de stockage Valeur recommandée Nom du compte de stockage Nom quelconque Type de compte de stockage LRS standard Vérifiez que l’Avis d’IA responsable est coché. Au bas de la page, sélectionnez Vérifier + créer, puis Créer.
Télécharger l'exemple de données
Si vous avez besoin d’exemples de données, nous avons fourni des exemples de données pour synthèse de texte et scénarios de synthèse de conversation à des fins de démarrage rapide.
Charger les exemples de données dans un conteneur d’objets blob
Retrouvez les fichiers à charger sur votre compte de stockage
Dans le Portail Azure, accédez au compte de stockage que vous avez créé et sélectionnez-le.
Dans votre compte de stockage, sélectionnez Conteneurs dans le menu de gauche, situé sous Stockage de données. Dans l’écran qui s’affiche, sélectionnez + Conteneur. Donnez au conteneur le nom exemple de données et laissez le Niveau d’accès public par défaut.
Une fois votre conteneur créé, sélectionnez-le. Sélectionnez ensuite le bouton Charger pour sélectionner les fichiers
.txt
et.json
que vous avez téléchargés précédemment.
Créez un projet de résumé personnalisé
Une fois votre ressource et votre compte de stockage configurés, créez un nouveau projet de résumé personnalisé. Un projet est une zone de travail qui vous permet de créer des modèles ML personnalisés en fonction de vos données. Seuls les utilisateurs qui disposent d’un accès à la ressource de langue utilisée peuvent accéder à votre projet.
Connectez-vous à Language Studio. Une fenêtre apparaît pour vous permettre de sélectionner votre abonnement et votre ressource Language. Sélectionnez la ressource de langue que vous avez créée à l’étape ci-dessus.
Sélectionnez la fonctionnalité que vous souhaitez utiliser dans Language Studio.
Sélectionnez Créer un projet dans le menu supérieur de la page des projets. La création d’un projet vous permet d’étiqueter les données, et d’entraîner, évaluer, améliorer et déployer vos modèles.
Entrez les informations relatives au projet, notamment son nom, sa description et la langue des fichiers qu’il contient. Si vous utilisez l’exemple de jeu de données, sélectionnez Anglais. Vous ne pouvez pas changer ultérieurement le nom de votre projet. Sélectionnez Suivant.
Conseil
Votre jeu de données n’a pas besoin d’être entièrement dans la même langue. Vous pouvez avoir plusieurs fichiers comportant des langues prises en charge différentes. Si votre jeu de données contient des documents en différentes langues ou si vous prévoyez des textes en d’autres langues au moment de l’exécution, sélectionnez l’option Activer un jeu de données multilingue quand vous entrez les informations de base de votre projet. Cette option peut être activée ultérieurement dans la page des Paramètres du projet.
Une fois que vous avez sélectionné Créer un projet, une fenêtre apparaît pour vous permettre de connecter votre compte de stockage. Si vous avez déjà connecté un compte de stockage, celui-ci s’affiche. Si ce n’est pas le cas, choisissez votre compte de stockage dans la liste déroulante qui s’affiche, puis sélectionnez Connecter le compte de stockage. Cette opération définit les rôles nécessaires pour votre compte de stockage. Cette étape peut retourner une erreur si le rôle propriétaire ne vous est pas attribué sur le compte de stockage.
Notes
- Vous ne devez effectuer cette étape qu’une seule fois pour chaque nouvelle ressource utilisée.
- Ce processus est irréversible. Si vous connectez un compte de stockage à votre ressource de langue, il n’est pas possible de le déconnecter ultérieurement.
- Vous pouvez connecter votre ressource de langue à un seul compte de stockage.
Sélectionnez le conteneur dans lequel vous avez chargé votre jeu de données.
Si vous avez déjà étiqueté les données, vérifiez qu’elles respectent le format pris en charge, puis sélectionnez Oui, mes fichiers comportent déjà des étiquettes et j’ai mis en forme le fichier d’étiquettes JSON. Sélectionnez ensuite le fichier d’étiquettes dans le menu déroulant. Sélectionnez Suivant. Si vous utilisez le jeu de données du guide de démarrage rapide, il n’est pas nécessaire de passer en revue la mise en forme du fichier d’étiquettes JSON.
Passez en revue les données entrées, puis sélectionnez Créer un projet.
Entraîner votre modèle
Une fois le projet créé, vous pouvez commencer à entraîner votre modèle.
Pour commencer à effectuer l’apprentissage de votre modèle à partir de Language Studio :
Dans le menu de gauche, sélectionnez Travaux d’entraînement.
Sélectionnez Démarrer un travail de formation dans le menu supérieur.
Sélectionnez Effectuer l’apprentissage d’un nouveau modèle, puis tapez le nom du modèle dans la zone de texte. Vous pouvez également remplacer un modèle existant en sélectionnant cette option et le modèle de votre choix dans le menu déroulant. La remplacement d’un modèle entraîné est irréversible. Toutefois, cela n’affecte pas vos modèles déployés tant que vous ne déployez pas le nouveau modèle.
Le système fractionne par défaut vos données étiquetées entre des ensembles d’entraînement et de test, selon des pourcentages spécifiés. Si vous avez des documents dans votre ensemble de test, vous pouvez fractionner manuellement les données d’entraînement et de test.
Sélectionner le bouton Train (Entraîner).
Si vous sélectionnez l’ID du travail d’apprentissage dans la liste, un volet latéral vous permet de vérifier la progression de la formation, l’état du travail et d’autres détails pour ce travail.
Notes
- Seuls les emplois de formation achevés avec succès génèrent des modèles.
- L’apprentissage peut durer de quelques minutes à plusieurs heures en fonction de la taille de vos données étiquetées.
- Vous ne pouvez avoir qu’un seul travail d’entraînement en cours d’exécution à la fois. Vous ne pouvez pas démarrer un autre travail d’apprentissage dans le même projet tant que le travail en cours d’exécution n’est pas terminé.
Déployer votre modèle
En règle générale, après avoir entraîné un modèle, vous passez en revue les détails de son évaluation et apportez si nécessaire des améliorations. Dans ce guide de démarrage rapide, vous allez simplement déployer votre modèle et le rendre disponible à des fins d’essai dans Language Studio.
Pour déployer votre modèle à partir de Language Studio :
Dans le menu de gauche, sélectionnez Déploiement d’un modèle.
Sélectionnez Ajouter un déploiement pour démarrer un nouveau travail de déploiement.
Sélectionnez Créer un déploiement pour créer un déploiement et attribuer un modèle entraîné dans la liste déroulante ci-dessous. Vous pouvez également Remplacer un déploiement existant en sélectionnant cette option et en sélectionnant le modèle entraîné que vous souhaitez attribuer dans la liste déroulante ci-dessous.
Notes
Le remplacement d’un déploiement existant ne nécessite pas de modifier votre appel de l’API de prédiction. Toutefois, les résultats obtenus sont basés sur le modèle qui vient d’être attribué.
Sélectionnez Déployer pour démarrer le travail de déploiement.
Une fois le déploiement réussi, une date d’expiration s’affiche à côté de celui-ci. L’expiration du déploiement correspond au moment où votre modèle déployé n’est plus disponible pour la prédiction. Cela se produit généralement douze mois après l’expiration d’une configuration de l’apprentissage.
Tester votre modèle
Pour ce guide de démarrage rapide, vous utilisez Language Studio pour envoyer la tâche de résumé personnalisé et visualiser les résultats. Dans l’exemple de jeu de données que vous avez téléchargé précédemment, vous trouvez des documents de test que vous pouvez utiliser à cette étape.
Pour tester vos modèles déployés à partir de Language Studio :
Sélectionnez Test des déploiements dans le menu de gauche.
Sélectionnez le déploiement à tester. Vous pouvez uniquement tester les modèles qui sont attribués aux déploiements.
Pour les projets multilingues, dans la liste déroulante de langue, sélectionnez la langue du texte que vous testez.
Sélectionnez le déploiement à interroger/tester dans la liste déroulante.
Vous pouvez entrer le texte que vous souhaitez envoyer à la demande ou charger un fichier
.txt
à utiliser.Sélectionnez Exécuter le test dans le menu supérieur.
Sous l’onglet Résultat, vous pouvez voir les entités extraites à partir de votre texte, et leurs types. Vous pouvez également voir la réponse JSON sous l’onglet JSON.
Nettoyer les ressources
Une fois que vous n’avez plus besoin de votre projet, vous pouvez le supprimer à l’aide de Language Studio. Sélectionnez dans la partie supérieure la fonctionnalité que vous utilisez, puis sélectionnez le projet que vous souhaitez supprimer. Sélectionnez Supprimer dans le menu supérieur pour supprimer le projet.
Étapes suivantes
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de l’année 2024, nous abandonnerons progressivement le mécanisme de retour d’information GitHub Issues pour le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultez :Soumettre et afficher des commentaires pour