Overzicht van Speech Synthesis Markup Language (SSML)

Speech Synthesis Markup Language (SSML) is een op XML gebaseerde opmaaktaal die u kunt gebruiken om uw tekst af te stemmen op spraakuitvoerkenmerken zoals toonhoogte, uitspraak, spreeksnelheid, volume en meer. Het geeft u meer controle en flexibiliteit dan tekstinvoer zonder opmaak.

Tip

U kunt stemmen horen in verschillende stijlen en toonhoogten voor het lezen van voorbeeldtekst met behulp van de spraakgalerie.

Use-casescenario's

SSML is ontworpen om u flexibiliteit te bieden in hoe u wilt dat uw spraakuitvoer klinkt en biedt verschillende eigenschappen voor hoe u die uitvoer kunt aanpassen. U kunt SSML gebruiken voor het volgende:

  • Definieer de structuur van de invoertekst die de structuur, inhoud en andere kenmerken van uw tekst naar spraakuitvoer bepaalt. U kunt bijvoorbeeld SSML gebruiken om een alinea, een zin, een pauze of stilte te definiëren. U kunt tekst laten teruglopen met gebeurtenistags, zoals een bladwijzer of viseme, die uw toepassing later kan verwerken. Een viseme is de visuele beschrijving van een foneme, de afzonderlijke spraakgeluiden, in gesproken taal.
  • Kies de stem, taal, naam, stijl en rol. U kunt meerdere stemmen gebruiken in één SSML-document. U kunt ook de nadruk, spreeksnelheid, toonhoogte en volume aanpassen. SSML kan ook vooraf opgenomen audio invoegen, zoals een geluidseffect of een muzieknotitie.
  • De uitspraak van de uitvoeraudio bepalen. U kunt bijvoorbeeld SSML gebruiken met telefoontjes en een aangepast lexicon om de uitspraak te verbeteren. U kunt SSML ook gebruiken om te definiëren hoe een woord of wiskundige expressie wordt uitgesproken.

Manieren om te werken met SSML

SSML-functionaliteit is beschikbaar in verschillende hulpprogramma's die mogelijk passen bij uw use-case.

Belangrijk

U wordt gefactureerd voor elk teken dat wordt geconverteerd naar spraak, inclusief leestekens. Hoewel het SSML-document zelf niet factureerbaar is, telt de service optionele elementen die u gebruikt om aan te passen hoe de tekst wordt geconverteerd naar spraak, zoals fonemes en pitch, als factureerbare tekens. Zie de prijsnotitie voor meer informatie.

U kunt SSML op de volgende manieren gebruiken:

Volgende stappen