Migrer d’une voix personnalisée vers une voix neuronale personnalisée

Article
03/07/2024

Important

Le niveau d’entraînement non neural standard de la voix personnalisée n’est plus en service depuis le 29 février 2024. Vous pouviez utiliser une voix personnalisée non neurale avec votre ressource Speech avant le 29 février 2024. Désormais, vous pouvez utiliser la voix neurale personnalisée seulement avec vos ressources Speech. Si vous avez une voix personnalisée non neurale, vous devez migrer vers une voix neurale personnalisée.

La voix neuronale personnalisée vous permet de créer des modèles vocaux de qualité supérieure tout en nécessitant moins de données. Vous pouvez développer des voix plus réalistes, naturelles et conversationnelles. Vos clients et utilisateurs finaux bénéficient de la dernière technologie de synthèse vocale de manière responsable.

Voix personnalisée	Voix neuronale personnalisée
La méthode standard ou « traditionnelle » de voix personnalisée décompose la parole en extraits phonétiques qui peuvent être remixés et mis en correspondance à l’aide de méthodes de programmation ou statistiques classiques.	La voix neuronale personnalisée synthétise la parole à l’aide de réseaux neuronaux profonds qui ont « appris » la manière dont les phonèmes sont combinés en voix humaine naturelle, au lieu d’utiliser des méthodes de programmation ou statistiques classiques.
La voix personnalisée¹ nécessite un volume important de données vocales pour produire un modèle de voix plus humain. Avec moins de lignes enregistrées, un modèle de voix personnalisée standard a tendance à sonner plus manifestement robotique.	La fonctionnalité de voix neuronale personnalisée vous permet de créer une voix de marque unique dans plusieurs langues et styles à l’aide d’un petit ensemble d’enregistrements.

¹ Lors de la création d’un modèle vocal personnalisé, les utilisateurs disposant d’un abonnement gratuit (F0) sont autorisés à importer 10 fichiers zip maximum par abonnement. Les utilisateurs disposant d’un abonnement standard (S0) peuvent importer 500 fichiers zip maximum par abonnement.

Action requise

Avant de pouvoir migrer vers une voix neuronale personnalisée, votre application doit être acceptée. L’accès au service de voix neuronale personnalisée relève de la seule discrétion de Microsoft en fonction de nos critères d’éligibilité. Vous devez vous engager à utiliser la voix neuronale personnalisée conformément à nos Principes de l’IA responsable et au Code de conduite.

Conseil

Même si vous n’avez pas de compte Azure, vous pouvez écouter des exemples vocaux dans Speech Studio et déterminer la voix adaptée aux besoins de votre entreprise.

Apprenez-en davantage sur notre stratégie de limitation de l’accès et demandez l’accès ici.
Une fois votre application approuvée, vous disposez de l’accès à la fonctionnalité de formation « neuronale ». Veillez à vous connecter à Speech Studio en utilisant le même abonnement Azure que celui que vous indiquez dans votre application.
Pour pouvoir entraîner et déployer un modèle Custom Voice, vous devez d’abord créer un profil d’artiste vocal. Le profil nécessite un fichier audio enregistré par l’artiste vocal, qui consent à l’utilisation de ses données vocales pour l’entraînement d’un modèle Custom Voice.
Mettez à jour votre code dans vos applications si vous avez créé un nouveau point de terminaison avec un nouveau modèle.

Détails de la voix personnalisée (déconseillé)

Lisez les sections suivantes pour obtenir des détails sur la voix personnalisée.

Support multilingue

La voix personnalisée prend en charge les langues suivantes (paramètres régionaux).

Langage	Paramètres régionaux
Chinois (mandarin, simplifié)	`zh-CN`
Chinois (mandarin, simplifié), anglais bilingue	`zh-CN` bilingue
Anglais (Inde)	`en-IN`
Anglais (Royaume-Uni)	`en-GB`
Anglais (États-Unis)	`en-US`
Français (France)	`fr-FR`
Allemand (Allemagne)	`de-DE`
Italien (Italie)	`it-IT`
Portugais (Brésil)	`pt-BR`
Espagnol (Mexique)	`es-MX`

Support régional

Si vous avez créé une police de la voix personnalisée, utilisez le point de terminaison que vous avez créé. Vous pouvez aussi utiliser les points de terminaison listés dans cette section, en remplaçant la valeur de {deploymentId} par l’ID de déploiement de votre modèle vocal.

Région	Point de terminaison
Australie Est	`https://australiaeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Brésil Sud	`https://brazilsouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Centre du Canada	`https://canadacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
USA Centre	`https://centralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Asie Est	`https://eastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
USA Est	`https://eastus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
USA Est 2	`https://eastus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
France Centre	`https://francecentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Inde Centre	`https://centralindia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Japon Est	`https://japaneast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
OuJapon Est	`https://japanwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Centre de la Corée	`https://koreacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Centre-Nord des États-Unis	`https://northcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Europe Nord	`https://northeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
États-Unis - partie centrale méridionale	`https://southcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Asie Sud-Est	`https://southeastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Sud du Royaume-Uni	`https://uksouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Europe Ouest	`https://westeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Centre-USA Ouest	`https://westcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
USA Ouest	`https://westus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
USA Ouest 2	`https://westus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`

Étapes suivantes

Essayer une voix neuronale personnalisée