Remarque
L’accès à cette page requiert une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page requiert une autorisation. Vous pouvez essayer de modifier des répertoires.
Remarque
La personnalisation du modèle speech, y compris la formation de prononciation, est disponible dans les comptes d’évaluation Azure Video Indexer et les comptes Resource Manager. Les comptes classiques ne prennent pas en charge cette fonctionnalité. Pour savoir comment utiliser l’expérience de langue personnalisée, consultez Personnaliser un modèle de langage.
Azure AI Video Indexer vous permet de créer des modèles vocaux personnalisés pour personnaliser la reconnaissance vocale en chargeant des jeux de données utilisés pour créer un modèle vocal. Cet article décrit les étapes à suivre via le site web Video Indexer. Vous pouvez également utiliser l’API, comme décrit dans Personnaliser le modèle speech à l’aide de l’API.
Pour obtenir une vue d’ensemble détaillée et des meilleures pratiques pour les modèles vocaux personnalisés, consultez Personnaliser un modèle speech avec Azure AI Video Indexer.
Prérequis
- Lisez le guide des meilleures pratiques de formation du modèle Speech.
- un compte Azure ;
- Un compte Azure AI Video Indexer
Créer un jeu de données
Comme tous les modèles personnalisés doivent contenir un jeu de données, commencez par le processus de création et de gestion des jeux de données.
- Sélectionnez le bouton Personnalisation du modèle.
- Sélectionnez l’onglet Speech (nouveau).
- Sélectionnez Charger le jeu de données.
- Sélectionnez Texte brut ou Prononciation dans le menu déroulant Type de jeu de données. Chaque modèle speech doit avoir un jeu de données de texte brut et peut éventuellement avoir un jeu de données de prononciation.
- Sélectionnez Parcourir et sélectionnez le fichier de jeu de données. Vous ne pouvez en choisir qu’un.
- Sélectionnez une langue pour le modèle. Choisissez la langue parlée dans les fichiers multimédias que vous prévoyez d’indexer avec ce modèle. Le nom du jeu de données est prérempli avec le nom du fichier, mais vous pouvez modifier le nom.
- Vous pouvez éventuellement ajouter une description du jeu de données. Il peut être utile de distinguer chaque jeu de données si vous prévoyez d’avoir plusieurs jeux de données.
- Sélectionnez Téléverser. Une fois la création du jeu de données terminée, vous pouvez l’utiliser pour l’apprentissage et la création de nouveaux modèles.
Examiner et mettre à jour un jeu de données
Vous pouvez afficher un jeu de données et ses propriétés en :
- Clic sur le nom du jeu de données
- Survoler le jeu de données
- Sélection des points de suspension
Ensuite, sélectionnez Afficher le jeu de données.
Vous pouvez ensuite afficher le nom, la description, la langue et l’état du jeu de données, ainsi que les propriétés suivantes :
Nombre de lignes : indique le nombre de lignes correctement chargées en dehors du nombre total de lignes dans le fichier. Si le fichier entier est chargé avec succès les nombres correspondent (par exemple, 10 sur 10 normalisés). Si les nombres ne correspondent pas (par exemple, 7 sur 10 normalisés), cela signifie que seules certaines lignes ont été correctement chargées et que le reste a rencontré des erreurs. Les causes courantes des erreurs sont des problèmes de mise en forme d’une ligne, tels que l’espacement d’un onglet entre chaque mot dans un fichier de prononciation. L’examen des données de texte brut et de prononciation pour les articles d’apprentissage doit être utile pour trouver le problème. Pour résoudre la cause, passez en revue les détails de l’erreur, qui sont contenus dans le rapport. Sélectionnez Afficher le rapport pour afficher les détails d’erreur concernant les lignes qui ne se chargent pas correctement (errorKind). Vous pouvez également l’afficher en sélectionnant l’onglet Rapport .
ID de jeu de données : chaque jeu de données a un GUID unique, ce qui est nécessaire lors de l’utilisation de l’API pour les opérations qui référencent le jeu de données.
Texte brut (normalisé) : il contient le texte normalisé du fichier de jeu de données chargé. Le texte normalisé est le texte reconnu sous forme simple sans mise en forme.
Modifier les détails : pour modifier le nom ou la description d’un jeu de données, lorsque vous pointez sur le jeu de données, sélectionnez les points de suspension, puis sélectionnez Modifier les détails. Vous pouvez ensuite modifier le nom et la description du jeu de données.
Remarque
Les données d’un jeu de données ne peuvent pas être modifiées ou mises à jour une fois le jeu de données chargé. Si vous devez modifier ou mettre à jour les données dans un jeu de données, téléchargez le jeu de données, effectuez les modifications, enregistrez le fichier et chargez le nouveau fichier de jeu de données.
Télécharger : pour télécharger un fichier de jeu de données, lorsque vous pointez sur le jeu de données, sélectionnez les points de suspension, puis sélectionnez Télécharger. Lorsque vous consultez le jeu de données, vous pouvez sélectionner Télécharger, puis choisir de télécharger soit le fichier du jeu de données, soit le rapport de téléchargement au format JSON.
Supprimer : pour supprimer un jeu de données, lorsque vous pointez sur le jeu de données, sélectionnez les points de suspension, puis sélectionnez Supprimer.
Créer un modèle de reconnaissance vocale personnalisée
Les jeux de données sont utilisés dans la création et l’apprentissage des modèles. Après avoir créé un jeu de données de texte brut, vous pouvez créer et commencer à utiliser un modèle de reconnaissance vocale personnalisé.
Gardez à l’esprit les points suivants lorsque vous créez et utilisez des modèles vocaux personnalisés :
- Un nouveau modèle doit inclure au moins un jeu de données de texte brut et peut avoir plusieurs jeux de données de texte brut.
- Il est facultatif d’inclure un jeu de données de prononciation et aucun autre ne peut être inclus.
- Une fois qu’un modèle est créé, vous ne pouvez pas y ajouter d’autres jeux de données ni y effectuer de modifications. Si vous devez ajouter ou modifier des jeux de données, créez un modèle.
- Si vous indexez une vidéo à l’aide d’un modèle de reconnaissance vocale personnalisée, puis supprimez le modèle, la transcription n’est pas affectée, sauf si vous effectuez une réindexation.
- Si vous avez supprimé un jeu de données utilisé pour entraîner un modèle personnalisé, il continue à l’utiliser jusqu’à ce que le modèle speech soit supprimé. La raison en est que le modèle de parole a été entraîné par l'ensemble de données.
- Si vous supprimez un modèle personnalisé, il n’affecte pas la transcription vidéo pour les vidéos déjà indexées à l’aide du modèle.
Entraîner un modèle
Remarque
Une fois qu’un modèle est créé, les jeux de données ne peuvent pas être ajoutés. Un modèle ne peut contenir que des jeux de données du même langage.
Il existe deux façons d’entraîner un modèle , par le biais de l’onglet jeu de données et de l’onglet modèle.
Entraîner un modèle via l’onglet Jeux de données
- Affichez la liste des jeux de données.
- Sélectionnez un jeu de données de texte brut. Sélectionnez ensuite le symbole Entraîner un nouveau modèle .
- Sélectionnez Entraîner un nouveau modèle.
- Entrez un nom pour le modèle, une langue et ajoutez éventuellement une description.
- Sélectionnez l’onglet Jeux de données
- Sélectionnez les jeux de données que vous souhaitez inclure dans le modèle.
- Sélectionnez Créer et former.
Entraîner un modèle par le biais de l’onglet Modèles
- Sélectionnez l’onglet Modèles.
- Sélectionnez l'icône Entraîner un nouveau modèle.
- Sélectionnez les jeux de données que vous souhaitez faire partie du modèle.
- Entrez un nom pour le modèle, une langue et ajoutez éventuellement une description.
- Sélectionnez l'onglet Jeux de données.
- Sélectionnez les jeux de données que vous souhaitez inclure dans le modèle.
- Sélectionnez Créer et former.
Examiner et mettre à jour un modèle
Afficher le modèle : vous pouvez afficher un modèle et ses propriétés en sélectionnant le nom du modèle ou lorsque vous pointez sur le modèle. Sélectionnez les points de suspension (...), puis sélectionnez Afficher le Modèle.
Vous voyez ensuite dans l’onglet Détails le nom, la description, la langue et l’état du modèle, ainsi que les propriétés suivantes :
ID de modèle : chaque modèle a un GUID unique, ce qui est nécessaire lors de l’utilisation de l’API pour les opérations qui référencent le modèle.
Créé le : date de création du modèle.
Modifier les détails : lorsque vous pointez sur le modèle, pour modifier le nom ou la description d’un modèle, sélectionnez l’icône des trois points, puis sélectionnez Modifier les détails. Vous pouvez ensuite modifier le nom et la description du modèle.
Remarque
Seul le nom et la description du modèle peuvent être modifiés. Si vous souhaitez apporter des modifications à ses jeux de données ou ajouter des jeux de données, un nouveau modèle doit être créé.
Supprimer : pour supprimer un modèle, lorsque vous pointez sur le jeu de données, sélectionnez les points de suspension, puis sélectionnez Supprimer.
Jeux de données inclus : sélectionnez l’onglet Jeux de données inclus pour afficher les jeux de données du modèle.
Utiliser un modèle de langage personnalisé lors de l’indexation d’une vidéo
Un modèle de langage personnalisé n’est pas utilisé par défaut pour les travaux d’indexation. Il doit donc être sélectionné pendant le processus de chargement d’index.
- Pendant le processus de chargement, sélectionnez votre source de modèle de langage personnalisé dans le menu déroulant de langue .
- Sélectionnez Téléverser.
Les mêmes étapes s’appliquent lorsque vous souhaitez réindexer une vidéo avec un modèle personnalisé.