Mi az a hangvezérelt asszisztens?
A Beszédszolgáltatás hangsegédjeinek használatával a fejlesztők természetes, emberi jellegű, beszélgetési felületeket hozhatnak létre az alkalmazásaikhoz és a felhasználói élményükhöz. A hangsegéd szolgáltatás gyors és megbízható interakciót biztosít egy eszköz és egy asszisztens implementációja között.
Segédmegoldás kiválasztása
A hangsegéd létrehozásának első lépése, hogy eldöntse, mit szeretne tenni. A Speech Service több kiegészítő megoldást kínál a segédek közötti interakciókhoz. Előfordulhat, hogy azt szeretné, hogy az alkalmazása támogassa a nyílt beszélgetéseket olyan kifejezésekkel, mint a "Seattle-be kell mennem" vagy a "Milyen pizzát rendelhetek?" A rugalmasság és a sokoldalúság érdekében hang- és hangátviteli képességeket adhat hozzá egy robothoz az Azure AI Bot Service és a Direct Line Speech csatorna használatával.
Ha még nem tudja biztosan, hogy mit szeretne az asszisztense elvégezni, javasoljuk , hogy a Direct Line Speech legyen a legjobb megoldás. Számos eszközzel és szerzői segédmel, például a Virtual Assistant megoldással, vállalati sablonnal és a QnA Maker szolgáltatással való integrációt kínál, hogy közös mintákra építsen, és használja a meglévő tudásforrásokat.
Referenciaarchitektúra a Beszéd SDK használatával hangsegéd létrehozásához
Alapvető funkciók
Akár a Direct Line Speechet, akár egy másik megoldást választ az asszisztensi interakciók létrehozásához, számos testreszabási funkcióval testre szabhatja az asszisztenst a márka, a termék és a személyiség alapján.
Kategória | Funkciók |
---|---|
Egyéni kulcsszó | A felhasználók egyéni kulcsszóval, például a "Hey Contoso" kulcsszóval kezdeményezhetnek beszélgetéseket az asszisztensekkel. Az alkalmazás ezt egy egyéni kulcsszómotorral teszi meg a Speech SDK-ban, amelyet az egyéni kulcsszavak használatának megkezdésével konfigurálhat. A hangsegédek szolgáltatásoldali kulcsszó-ellenőrzéssel javíthatják a kulcsszóaktiválás pontosságát (szemben az eszköz egyedüli használatával). |
Beszéd szöveggé | A hangsegédek felismert szöveggé alakítják a valós idejű hangot a Speech szolgáltatásból származó beszédből szöveggé . Ez a szöveg átíráskor elérhető az asszisztens implementációjához és az ügyfélalkalmazáshoz is. |
Szövegfelolvasás | Az asszisztens szöveges válaszait szövegről beszédre szintetizálja a Speech szolgáltatás. Ez a szintézis ezután elérhetővé válik az ügyfélalkalmazás számára hangstreamként. A Microsoft saját egyéni, kiváló minőségű neurális szövegfelolvasási (Neurális TTS-) hang készítését teszi lehetővé, amely hangot ad a márkának. |
A hangsegédek használatának első lépései
A következő rövid útmutatót ajánljuk, amely úgy lett kialakítva, hogy 10 percnél kevesebb perc alatt futtassa a kódot: Rövid útmutató: Egyéni hangsegéd létrehozása a Direct Line Speech használatával
Mintakódok és oktatóanyagok
A hangsegéd létrehozására szolgáló mintakód a GitHubon érhető el. A minták az ügyfélalkalmazást fedik le, amely több népszerű programozási nyelven csatlakozik az asszisztenséhez.
- Hangsegédminták a GitHubon
- Oktatóanyag: Hangalapú asszisztens, amely az Azure AI Bot Service és a C# Speech SDK használatával készült
Testreszabás
A Speech szolgáltatással létrehozott hangsegédek számos testreszabási lehetőséget használhatnak.
Feljegyzés
A testreszabási lehetőségek nyelvtől és területi beállításoktól függően változnak. További információ: Támogatott nyelvek.