Partage via


Personnaliser un modèle de reconnaissance vocale

Remarque

La personnalisation du modèle speech, y compris la formation de prononciation, est prise en charge uniquement dans les comptes d’évaluation Azure Video Indexer et les comptes Resource Manager. Il n’est pas pris en charge dans les comptes classiques. Pour obtenir des conseils sur la façon de mettre à jour votre type de compte sans frais, consultez le compte Mettre à jour votre compte Azure AI Video Indexer. Pour obtenir des conseils sur l’utilisation de l’expérience de langue personnalisée, consultez Personnaliser un modèle de langue.

Azure AI Video Indexer vous permet de créer des modèles vocaux personnalisés pour personnaliser la reconnaissance vocale en chargeant des jeux de données utilisés pour créer un modèle vocal. Cet article décrit les étapes à suivre via le site web Video Indexer. Vous pouvez également utiliser l’API, comme décrit dans Personnaliser le modèle speech à l’aide de l’API.

Pour obtenir une vue d’ensemble détaillée et des meilleures pratiques pour les modèles vocaux personnalisés, consultez Personnaliser un modèle speech avec Azure AI Video Indexer.

Prérequis

Créer un jeu de données

Comme tous les modèles personnalisés doivent contenir un jeu de données, nous allons commencer par le processus de création et de gestion des jeux de données.

  1. Sélectionnez le bouton Personnalisation du modèle.
  2. Sélectionnez l’onglet Speech (nouveau).
  3. Sélectionnez Charger le jeu de données.
  4. Sélectionnez texte brut ou prononciation dans le menu déroulant Type de jeu de données. Chaque modèle speech doit avoir un jeu de données de texte brut et peut éventuellement avoir un jeu de données de prononciation.
  5. Sélectionnez Parcourir et sélectionnez le fichier de jeu de données. Vous ne pouvez en choisir qu’un.
  6. Sélectionnez une langue pour le modèle. Choisissez la langue parlée dans les fichiers multimédias que vous prévoyez d’indexer avec ce modèle. Le nom du jeu de données est prérempli avec le nom du fichier, mais vous pouvez modifier le nom.
  7. Vous pouvez éventuellement ajouter une description du jeu de données. Cela peut être utile pour distinguer chaque jeu de données si vous prévoyez d’avoir plusieurs jeux de données.
  8. Sélectionnez Charger. Une fois la création du jeu de données terminée, vous pouvez l’utiliser pour l’apprentissage et la création de nouveaux modèles.

Examiner et mettre à jour un jeu de données

Vous pouvez afficher un jeu de données et ses propriétés en :

  • Clic sur le nom du jeu de données
  • Pointage sur le jeu de données
  • Sélection des points de suspension

Ensuite, sélectionnez Afficher le jeu de données.

Vous pouvez ensuite afficher le nom, la description, la langue et l’état du jeu de données, ainsi que les propriétés suivantes :

Nombre de lignes : indique le nombre de lignes correctement chargées en dehors du nombre total de lignes dans le fichier. Si l’intégralité du fichier est chargée, les nombres correspondent (par exemple, 10 sur 10 normalisés). Si les nombres ne correspondent pas (par exemple, 7 sur 10 normalisés), cela signifie que seules certaines lignes ont été correctement chargées et que le reste a eu des erreurs. Les causes courantes des erreurs sont des problèmes de mise en forme d’une ligne, tels que l’espacement d’un onglet entre chaque mot dans un fichier de prononciation. L’examen des données de texte brut et de prononciation pour les articles d’apprentissage doit être utile pour trouver le problème. Pour résoudre la cause, passez en revue les détails de l’erreur, qui sont contenus dans le rapport. Sélectionnez Afficher le rapport pour afficher les détails d’erreur concernant les lignes qui ne se chargent pas correctement (errorKind). Vous pouvez également l’afficher en sélectionnant l’onglet Rapport .

ID de jeu de données : chaque jeu de données a un GUID unique, ce qui est nécessaire lors de l’utilisation de l’API pour les opérations qui référencent le jeu de données.

Texte brut (normalisé) : contient le texte normalisé du fichier de jeu de données chargé. Le texte normalisé est le texte reconnu sous forme simple sans mise en forme.

Modifier les détails : pour modifier le nom ou la description d’un jeu de données, lorsque vous pointez sur le jeu de données, sélectionnez les points de suspension, puis sélectionnez Modifier les détails. Vous pouvez ensuite modifier le nom et la description du jeu de données.

Remarque

Les données d’un jeu de données ne peuvent pas être modifiées ou mises à jour une fois le jeu de données chargé. Si vous devez modifier ou mettre à jour les données dans un jeu de données, téléchargez le jeu de données, effectuez les modifications, enregistrez le fichier et chargez le nouveau fichier de jeu de données.

Télécharger : pour télécharger un fichier de jeu de données, lorsque vous pointez sur le jeu de données, sélectionnez les points de suspension, puis sélectionnez Télécharger. Vous pouvez également sélectionner Télécharger, puis télécharger le fichier de jeu de données ou télécharger le rapport au format JSON.

Supprimer : pour supprimer un jeu de données, lorsque vous pointez sur le jeu de données, sélectionnez les points de suspension, puis sélectionnez Supprimer.

Créer un modèle de reconnaissance vocale personnalisée

Les jeux de données sont utilisés dans la création et l’apprentissage des modèles. Une fois que vous avez créé un jeu de données de texte brut, vous pouvez créer et commencer à utiliser un modèle de reconnaissance vocale personnalisé.

Gardez à l’esprit les éléments suivants lors de la création et de l’utilisation de modèles vocaux personnalisés :

  • Un nouveau modèle doit inclure au moins un jeu de données de texte brut et peut avoir plusieurs jeux de données de texte brut.
  • Il est facultatif d’inclure un jeu de données de prononciation et aucun autre ne peut être inclus.
  • Une fois qu’un modèle est créé, vous ne pouvez pas y ajouter de jeux de données supplémentaires ni y effectuer de modifications. Si vous devez ajouter ou modifier des jeux de données, créez un modèle.
  • Si vous avez indexé une vidéo à l’aide d’un modèle de reconnaissance vocale personnalisée, puis supprimez le modèle, la transcription n’est pas affectée, sauf si vous effectuez une réindexation.
  • Si vous avez supprimé un jeu de données utilisé pour entraîner un modèle personnalisé, car le modèle vocal a déjà été entraîné par le jeu de données, il continue de l’utiliser jusqu’à ce que le modèle vocal soit supprimé.
  • Si vous supprimez un modèle personnalisé, il n’a aucun impact sur la transcription de vidéos déjà indexées à l’aide du modèle.

Entraîner un modèle

Remarque

Une fois qu’un modèle est créé, les jeux de données ne peuvent pas être ajoutés. Un modèle ne peut contenir que des jeux de données du même langage.

Il existe deux façons d’entraîner un modèle , par le biais de l’onglet jeu de données et de l’onglet modèle.

Entraîner un modèle via l’onglet Jeux de données

  1. Affichez la liste des jeux de données.
  2. Sélectionnez un jeu de données de texte brut. L’icône Entraîner un nouveau modèle ci-dessus peut ensuite être sélectionnée.
  3. Sélectionnez Entraîner un nouveau modèle.
  4. Entrez un nom pour le modèle, une langue et ajoutez éventuellement une description.
  5. Sélectionnez l’onglet Jeux de données
  6. Sélectionnez les jeux de données que vous souhaitez inclure dans le modèle.
  7. Sélectionnez Créer et entraîner.

Entraîner un modèle par le biais de l’onglet Modèles

  1. Sélectionnez l’onglet Modèles.
  2. Sélectionnez l’icône Entraîner un nouveau modèle .
  3. Sélectionnez les jeux de données que vous souhaitez faire partie du modèle.
  4. Entrez un nom pour le modèle, une langue et ajoutez éventuellement une description.
  5. Sélectionnez l'onglet Jeux de données.
  6. Sélectionnez les jeux de données que vous souhaitez inclure dans le modèle.
  7. Sélectionnez Créer et entraîner.

Examiner et mettre à jour un modèle

Afficher le modèle : vous pouvez afficher un modèle et ses propriétés en cliquant sur le nom du modèle ou en pointant sur le modèle, en cliquant sur les points de suspension, puis en sélectionnant Afficher le modèle.

Vous verrez ensuite dans l’onglet Détails le nom, la description, la langue et l’état du modèle, ainsi que les propriétés suivantes :

ID de modèle : chaque modèle a un GUID unique, ce qui est nécessaire lors de l’utilisation de l’API pour les opérations qui référencent le modèle.

Créé le : date de création du modèle.

Modifier les détails : pour modifier le nom ou la description d’un modèle, lorsque vous pointez sur le modèle, sélectionnez les points de suspension, puis sélectionnez Modifier les détails. Vous pouvez ensuite modifier le nom et la description du modèle.

Remarque

Seul le nom et la description du modèle peuvent être modifiés. Si vous souhaitez apporter des modifications à ses jeux de données ou ajouter des jeux de données, un nouveau modèle doit être créé.

Supprimer : pour supprimer un modèle, lorsque vous pointez sur le jeu de données, sélectionnez les points de suspension, puis sélectionnez Supprimer.

Jeux de données inclus : sélectionnez l’onglet Jeux de données inclus pour afficher les jeux de données du modèle.

Utiliser un modèle de langage personnalisé lors de l’indexation d’une vidéo

Un modèle de langage personnalisé n’est pas utilisé par défaut pour les travaux d’indexation. Il doit donc être sélectionné pendant le processus de chargement d’index.

  1. Pendant le processus de chargement, sélectionnez votre source de modèle de langage personnalisé dans le menu déroulant de langue .
  2. Sélectionnez Charger.

Les mêmes étapes s’appliquent lorsque vous souhaitez réindexer une vidéo avec un modèle personnalisé.