Utiliser l’étiquetage Azure Machine Learning dans Language Studio

L’étiquetage de données est une partie importante de la préparation de votre jeu de données. Grâce à l’expérience d’étiquetage dans Azure Machine Learning, vous pouvez bénéficier d’une collaboration plus facile, d’une flexibilité accrue et de la possibilité d’externaliser des tâches d’étiquetage à des fournisseurs d’étiquetage externes à partir de Azure Market Place. Vous pouvez utiliser l’étiquetage Azure Machine Learning pour :

Prérequis

Avant de pouvoir connecter votre projet d’étiquetage à Azure Machine Learning, vous avez besoin des éléments suivants :

  • Un projet Language Studio créé correctement avec un compte Stockage Blob Azure configuré.
  • Des données textuelles qui ont été chargées dans votre compte de stockage.
  • Au moins :
    • Une étiquette d’entité pour la reconnaissance d’entité nommée personnalisée, ou
    • Deux étiquettes de classe pour les projets de classification de texte personnalisés.
  • Espace de travail Azure Machine Learning qui a été connecté au même compte de stockage d’objets blob Azure que celui utilisé par votre compte Language Studio.

Limites

  • La connexion de votre projet d’étiquetage à Azure Machine Learning est une connexion un-à-un. Si vous déconnectez votre projet, vous ne pourrez pas reconnecter votre projet au même projet Azure Machine Learning
  • Vous ne pouvez pas étiqueter simultanément dans Language Studio et Azure Machine Learning. L’expérience d’étiquetage est activée dans un studio à la fois.
  • Les fichiers de test et d’entraînement de l’expérience d’étiquetage dont vous vous éloignez seront ignorés lors de l’entraînement de votre modèle.
  • Seul le format de fichier JSONL de Azure Machine Learning peut être importé dans Language Studio.
  • Les projets avec l’option multilingue activée ne peuvent pas être connectés à Azure Machine Learning, et tous les langages ne sont pas pris en charge.
  • L’espace de travail Azure Machine Learning auquel vous vous connectez doit être affecté au même compte stockage Azure auquel Language Studio est connecté. Assurez-vous que l’espace de travail Azure Machine Learning dispose de l’autorisation lecteur de données blob de stockage sur le compte de stockage. L’espace de travail doit avoir été lié au compte de stockage pendant le processus de création dans le Portail Azure.
  • Le basculement entre les deux expériences d’étiquetage n’est pas instantané. L’opération peut prendre du temps.

Importer vos étiquettes Azure Machine Learning dans Language Studio

Language Studio prend en charge le format de fichier JSONL utilisé par Azure Machine Learning. Si vous avez étiqueté des données sur Azure Machine Learning, vous pouvez importer vos étiquettes à jour dans un nouveau projet personnalisé pour utiliser les fonctionnalités des deux studios.

  1. Commencez par créer un projet pour la classification de texte personnalisée ou la reconnaissance d’entités nommées personnalisées.

    1. Dans l’écran Créer un projet qui s’affiche, suivez les invites pour connecter votre compte de stockage et entrez les informations de base sur votre projet. Assurez-vous que la ressource Azure que vous utilisez n’a pas d’autre compte de stockage déjà connecté.

    2. Dans la section Choisir un conteneur, choisissez l’option indiquant que vous disposez déjà d’un fichier correctement mis en forme. Sélectionnez ensuite votre fichier d’étiquettes Azure Machine Learning le plus récent.

      Capture d’écran montrant la sélection pour un fichier étiquette dans Language Studio.

Se connecter à Azure Machine Learning

Avant de vous connecter à Azure Machine Learning, vous avez besoin d’un compte Azure Machine Learning avec un plan tarifaire qui peut répondre aux besoins de calcul de votre projet. Consultez la section Prérequis pour vous assurer que vous avez correctement rempli toutes les conditions requises pour commencer à connecter votre projet Language Studio à Azure Machine Learning.

  1. Utilisez le Portail Azure pour accéder au compte Stockage Blob Azure connecté à votre ressource de langue.

  2. Vérifiez que le rôle Contributeur aux données blob de stockage est attribué à votre espace de travail AML dans les attributions de rôle pour votre compte Stockage Blob Azure.

  3. Naviguez vers votre projet dans Langage Studio. Dans le menu de navigation de gauche de votre projet, sélectionnez Étiquetage des données.

  4. Sélectionnez Utiliser Azure Machine Learning pour étiqueter dans la description de l’étiquetage des données ou sous le volet Activité.

    Capture d’écran montrant l’emplacement du lien Azure Machine Learning.

  5. Sélectionnez Se connecter à Azure Machine Learning pour démarrer le processus de connexion.

    Une capture d’écran montrant le bouton de connexion Azure Machine Learning dans Language Studio.

  6. Dans la fenêtre qui s’affiche, suivez les invites. Sélectionnez l’espace de travail Azure Machine Learning que vous avez créé précédemment sous le même abonnement Azure. Entrez un nom pour le nouveau projet Azure Machine Learning qui sera créé pour activer l’étiquetage dans Azure Machine Learning.

    Conseil

    Assurez-vous que votre espace de travail est lié au même compte Stockage Blob Azure et à la même ressource langage avant de continuer. Vous pouvez créer un espace de travail et créer un lien vers votre compte de stockage utilisant le Portail Azure. Vérifiez la liaison adéquate entre le compte de stockage et l’espace de travail.

  7. (Facultatif) Activez le bouton bascule d’étiquetage du fournisseur pour utiliser les sociétés fournisseurs d’étiquetage. Avant de choisir les sociétés d’étiquetage des fournisseurs, contactez les sociétés d’étiquetage du fournisseur sur le Place de marché Azure pour finaliser un contrat avec elles. Pour plus d’informations sur l’utilisation avec des sociétés fournisseurs, consultez Guide pratique pour externaliser l’étiquetage des données.

    Vous pouvez également laisser des instructions d’étiquetage pour les étiqueteurs humains qui vous aideront dans le processus d’étiquetage. Ces instructions peuvent les aider à comprendre la tâche en laissant des définitions claires des étiquettes et en incluant des exemples pour de meilleurs résultats.

  8. Passez en revue les paramètres de votre connexion à Azure Machine Learning et apportez des modifications si nécessaire.

    Important

    La finalisation de la connexion est permanente. La tentative de déconnexion de votre connexion établie à tout moment empêche définitivement votre projet Language Studio de se connecter au même projet Azure Machine Learning.

  9. Une fois la connexion lancée, votre capacité à étiqueter les données dans Language Studio est désactivée pendant quelques minutes pour préparer la nouvelle connexion.

Basculer vers l’étiquetage avec Azure Machine Learning à partir de Language Studio

Une fois la connexion établie, vous pouvez basculer vers Azure Machine Learning via le volet Activité de Language Studio à tout moment.

Une capture d’écran montrant le bouton pour basculer vers l’étiquetage avec Azure Machine Learning.

Lorsque vous basculez, votre capacité à étiqueter des données dans Language Studio est désactivée et vous pouvez étiqueter les données dans Azure Machine Learning. Vous pouvez revenir à l’étiquetage dans Language Studio à tout moment via Azure Machine Learning.

Pour plus d’informations sur la façon d’étiqueter le texte, consultez Comment étiqueter Azure Machine Learning. Pour plus d’informations sur la gestion et le suivi du projet d’étiquetage de texte, consultez Configurer et gérer un projet d’étiquetage de texte Azure Machine Learning.

Entraîner votre modèle à l’aide d’étiquettes de Azure Machine Learning

Lorsque vous basculez vers l’étiquetage à l’aide de Azure Machine Learning, vous pouvez toujours entraîner, évaluer et déployer votre modèle dans Language Studio. Pour entraîner votre modèle à l’aide d’étiquettes mises à jour de Azure Machine Learning :

  1. Sélectionnez Travaux de formation dans le menu de navigation à gauche de l’écran Language Studio de votre projet.

  2. Sélectionnez Importer les dernières étiquettes à partir de Azure Machine Learning dans la section Choisir l’origine de l’étiquette de la page de formation. Cela synchronise les étiquettes de Azure Machine Learning avant de commencer le travail d’entraînement.

    Une capture d’écran montrant le sélecteur pour utiliser des étiquettes de Azure Machine Learning.

Basculer vers l’étiquetage avec Language Studio à partir de Azure Machine Learning

Une fois que vous avez basculé vers l’étiquetage avec Azure Machine Learning, vous pouvez revenir à l’étiquetage avec le projet Language Studio à tout moment.

Notes

  • Seuls les utilisateurs disposant des rôles appropriés dans Azure Machine Learning ont la possibilité de basculer l’étiquetage.
  • Lorsque vous basculez vers l’utilisation de Language Studio, l’étiquetage sur Azure Machine Learning est désactivé.

Pour revenir à l’étiquetage avec Language Studio :

  1. Accédez à votre projet dans Azure Machine Learning et sélectionnez Étiquetage des données dans le menu de navigation de gauche.

  2. Sélectionnez l’onglet Language Studio et sélectionnez Basculer vers Language Studio.

    Une capture d’écran montrant le sélecteur pour utiliser des étiquettes de Language Studio.

  3. Le processus prend quelques minutes, et votre capacité à étiqueter dans Azure Machine Learning est désactivée jusqu’à ce qu’elle soit retournée à partir de Language Studio.

Déconnexion de Azure Machine Learning

La déconnexion de votre projet de Azure Machine Learning est un processus permanent et irréversible qui ne peut pas être annulé. Vous ne pourrez plus accéder à vos étiquettes dans Azure Machine Learning et vous ne pourrez plus reconnecter le projet Azure Machine Learning à un projet Language Studio à l’avenir. Pour vous déconnecter de Azure Machine Learning :

  1. Assurez-vous que les étiquettes mises à jour que vous souhaitez conserver sont synchronisées avec Azure Machine Learning en rebasculant l’expérience d’étiquetage vers Language Studio.
  2. Sélectionnez Paramètres du projet dans le menu de navigation de gauche dans Language Studio.
  3. Sélectionnez le bouton Déconnecter de Azure Machine Learning dans la section Gérer les connexions Azure Machine Learning .

Étapes suivantes

En savoir plus sur l’étiquetage de vos données pour la classification de texte personnalisée et lareconnaissance d’entités nommées personnalisées.