Beszédszintézis korrektúranyelv (SSML) áttekintése
A Beszédszintézis korrektúranyelv (SSML) egy XML-alapú korrektúranyelv, amellyel a szöveg finomhangolható a beszédkimeneti attribútumokra, például a hangmagasságra, a kiejtésre, a beszédsebességre, a hangerőre stb. Nagyobb vezérlést és rugalmasságot biztosít, mint az egyszerű szöveges bevitel.
Tipp.
A Hangtár használatával különböző stílusokban és hangmagasságokban hallhatja a példaszöveget olvasó hangokat.
Használati helyzetek
Az SSML úgy lett kialakítva, hogy rugalmasan hangozzon a beszédkimenet, és különböző tulajdonságokat biztosít a kimenet testreszabásához. Az SSML-t a következőre használhatja:
- Határozza meg a bemeneti szöveg struktúráját , amely meghatározza a szöveg és a beszéd kimenetének szerkezetét, tartalmát és egyéb jellemzőit. Az SSML használatával például definiálhat bekezdést, mondatot, szünetet, szünetet vagy csendet. Az alkalmazás később feldolgozható eseménycímkékkel(például könyvjelzőkkel vagy viseme-ekkel) tördelheti a szöveget. A viseme a telefon képi leírása, az egyes beszédhangok beszélt nyelven.
- Válassza ki a hangot, a nyelvet, a nevet, a stílust és a szerepkört. Egyetlen SSML-dokumentumban több hang is használható. A hangsúly, a beszédsebesség, a hangmagasság és a hangerő is módosítható. Az SSML előre rögzített hangokat is beszúrhat, például hangeffektust vagy zenei megjegyzést.
- A kimeneti hang kiejtésének szabályozása. Használhatja például az SSML-t telefonnal és egyéni lexikonnal a kiejtés javítására. Az SSML használatával azt is meghatározhatja, hogy egy szó vagy matematikai kifejezés hogyan legyen kimondva.
Az SSML-vel való munka módjai
Az SSML-funkciók különböző eszközökben érhetők el, amelyek illeszkedhetnek a használati esethez.
Fontos
A rendszer minden beszédgé konvertált karakter után kiszámláz, beleértve az írásjeleket is. Bár maga az SSML-dokumentum nem számlázható, a szolgáltatás számlálja azokat a választható elemeket, amelyeket a szöveg beszédgé alakításához használ, például a hangmagasságot és a hangmagasságot számlázható karakterként. További információkért tekintse meg a díjszabási megjegyzést.
Az SSML a következő módokon használható:
- A hangtartalom-létrehozó eszközzel egyszerű szöveget és SSML-t készíthet a Speech Studióban. Meghallgathatja a kimeneti hangot, és módosíthatja az SSML-t a beszédszintézis javítása érdekében. További információ: Beszédszintézis a Hangtartalom létrehozása eszközzel.
- A batch synthesis API a tulajdonságon keresztül fogadja el az SSML-t
inputs
. - A Speech CLI a parancssori argumentumon keresztül fogadja el az
spx synthesize --ssml SSML
SSML-t. - A Speech SDK a "speak" SSML metóduson keresztül fogadja el az SSML-t a különböző támogatott nyelvek között.