Vue d’ensemble du langage de balisage de synthèse vocale (SSML, Speech Synthesis Markup Language)

Le langage de balisage de synthèse vocale (SSML, Speech Synthesis Markup Language) est un langage de balisage XML qui peut être utilisé pour affiner les attributs de sortie de synthèse vocale comme la hauteur, la prononciation, le débit de parole, le volume, etc. Vous disposez de plus de contrôle et de flexibilité par rapport une entrée de texte brut.

Conseil

Vous pouvez écouter les voix dans différents styles et tonalités avec la lecture de texte d’exemple dans la Galerie de voix.

Scénarios

Vous pouvez utiliser SSML pour :

  • Définir la structure du texte d’entrée qui détermine la structure, le contenu et d’autres caractéristiques de la sortie de synthèse vocale. Par exemple, vous pouvez utiliser SSML pour définir un paragraphe, une phrase, une pause ou un silence. Vous pouvez entourer du texte à l’aide de balises d’événement, comme un signet ou un visème, qui peuvent être traitées ultérieurement par votre application.
  • Choisir la voix, la langue, le nom, le style et le rôle. Vous pouvez utiliser plusieurs voix dans un seul document SSML. Ajustez l’accentuation, le débit, la tonalité et le volume. Vous pouvez également utiliser SSML pour insérer de l’audio préenregistré, comme un effet sonore ou une note de musique.
  • Contrôler la prononciation de l’audio de sortie. Par exemple, vous pouvez utiliser SSML avec des phonèmes et un lexique personnalisé pour améliorer la prononciation. Vous pouvez aussi utiliser SSML pour définir la façon dont un mot ou une expression mathématique sont prononcés.

Utiliser SSML

Important

Vous êtes facturé pour chaque caractère converti en parole, y compris les signes de ponctuation. Même si le document SSML lui-même n’est pas facturable, les éléments facultatifs utilisés pour ajuster la façon dont le texte est converti en parole, tels que les phonèmes et la tonalité de la voix, sont comptabilisés comme caractères facturables. Pour plus d’informations, consultez les notes de tarification de synthèse vocale.

Vous pouvez utiliser SSML des manières suivantes :

Étapes suivantes