Mi az a Speech Studio?
A Speech Studio egy felhasználói felületi eszközök készlete, amelyekkel az Azure AI Speech szolgáltatás funkcióit építheti ki és integrálhatja az alkalmazásokban. A Speech Studióban kód nélküli megközelítéssel hozhat létre projekteket, majd a Speech SDK, a Speech CLI vagy a REST API-k használatával hivatkozhat az alkalmazásokban lévő eszközökre.
Tipp.
Az AI Studióban anélkül is kipróbálhatja a beszédet szöveggé és szöveggé, hogy ne regisztrálná vagy írná a kódot.
Speech Studio-forgatókönyvek
Néhány gyakori használati eset mintakódjának megismerése, kipróbálása és megtekintése.
Feliratozás: Válasszon ki egy minta videoklipet a valós idejű vagy offline feldolgozott feliratozási eredmények megtekintéséhez. Megtudhatja, hogyan szinkronizálhatja a feliratokat a bemeneti hanggal, alkalmazhat trágár szűrőket, kaphat részleges eredményeket, alkalmazhat testreszabásokat, és azonosíthat beszélt nyelveket többnyelvű forgatókönyvek esetén. További információkért tekintse meg a feliratozási rövid útmutatót.
Call Center: Bemutató megtekintése arról, hogyan használható a Language and Speech services a call center-beszélgetések elemzésére. Valós időben átírhatja a hívásokat, vagy feldolgozhat egy hívásköteget, személyre szabott azonosítási adatokat hozhat létre, és olyan megállapításokat nyerhet ki, mint a hangulat, amelyek segítenek a call center használati ügyében. További információkért tekintse meg a telefonos ügyfélszolgálat rövid útmutatóját.
A Speech Studióban bemutatott forgatókönyvek bemutatásához tekintse meg ezt a bevezető videót.
A Speech Studio funkciói
A Speech Studióban a következő Speech service-funkciók érhetők el projekttípusokként:
Valós idejű szövegfelolvasás: A hangfájlok ide húzásával gyorsan tesztelheti a szöveghez való beszédet anélkül, hogy bármilyen kódot kellene használnia. A Speech Studio egy bemutató eszközzel mutatja be, hogyan működik a szövegfelolvasás a hangmintákon. A teljes funkció megismeréséhez tekintse meg a Szöveg beszéde című témakört.
Batch speech to text: A batch-átírási képességek gyors tesztelése nagy mennyiségű hang átviteléhez a tárolóban, és aszinkron módon fogadja az eredményeket. A Batch Beszéd szöveggé funkcióval kapcsolatos további információkért tekintse meg a Batch beszédről szövegre című áttekintését.
Egyéni beszéd: Meghatározott szókészletekre és beszédstílusokra szabott beszédfelismerési modellek létrehozása. Az alapszintű beszédfelismerési modellel ellentétben az egyéni beszédmodellek az egyedi versenyelőny részét képezik, mivel nem érhetők el nyilvánosan. Ha egyéni beszédmodell létrehozásához szeretne mintahangot feltölteni, tekintse meg a betanítási és tesztelési adathalmazok feltöltését ismertető szakaszt.
Kiejtési értékelés: A beszéd kiejtésének kiértékelése és a beszélők visszajelzése a beszélt hang pontosságáról és folyékonyságáról. A Speech Studio egy tesztkörnyezetet biztosít a funkció gyors, kód nélküli teszteléséhez. Ha a funkciót a Speech SDK-val szeretné használni az alkalmazásokban, tekintse meg a kiejtésértékelési cikket.
Beszédfordítás: Gyorsan tesztelheti és lefordíthatja a beszédet más, ön által választott nyelvekre, alacsony késéssel. A teljes funkció megismeréséhez tekintse meg a beszédfordítást.
Hanggaléria: Olyan alkalmazások és szolgáltatások létrehozása, amelyek természetesen beszélnek. Nyelvek, hangok és változatok széles választéka közül választhat. A forgatókönyveket rendkívül kifejező és emberszerű neurális hangokkal keltheti életre.
Egyéni hang: Egyéni, egyedi hangokat hozhat létre a szövegfelolvasáshoz. A Speech Studióban hangfájlokat adhat meg, és megfelelő átiratokat hozhat létre, majd használhatja az egyéni hangokat az alkalmazásokban. Ha egyéni hangokat szeretne létrehozni és használni végpontokon keresztül, olvassa el a hangmodell létrehozása és használata című témakört.
Hangtartalmak létrehozása: A szöveg és a beszédszintézis kód nélküli megközelítése. Használhatja a kimeneti hangokat, vagy kiindulási pontként a további testreszabáshoz. Rendkívül természetes hangtartalmakat hozhat létre különböző forgatókönyvekhez, például hangoskönyvekhez, hírközvetítésekhez, video narrációkhoz és csevegőrobotokhoz. További információkért tekintse meg a hangtartalom-létrehozás dokumentációját.
Egyéni kulcsszó: Az egyéni kulcsszó egy szó vagy rövid kifejezés, amellyel hangalapúan aktiválhat egy terméket. Létrehozhat egy egyéni kulcsszót a Speech Studióban, majd létrehoz egy bináris fájlt, amelyet a Speech SDK-val használhat az alkalmazásokban.