A speech API-szolgáltatások típusai
Az Azure Cognitive Services Speech szolgáltatással szóbeli nyelvi átalakításokat hajthat végre, beleértve a beszédfelismerést, a szövegfelolvasást, a beszédfordítást és a beszélőfelismerést.
Megjegyzés
Használja az Azure Cognitive Service for Language szolgáltatást, ha kifejezésekkel vagy kifejezésekkel kapcsolatos megállapításokat szeretne gyűjteni, vagy részletes kontextuselemzést szeretne kapni a beszélt vagy írott nyelvről.
Szolgáltatások
- A beszédfelismerés valós időben vagy kötegben képes szöveggé alakítani a hangstreameket.
- A szövegfelolvasás lehetővé teszi, hogy az alkalmazások emberi beszédgé alakítsa a szöveget.
- A beszédfordítás többnyelvű beszédfelolvasást és a hangstreamek szöveggé alakítását teszi lehetővé.
Beszédszolgáltatás kiválasztása
Ez a folyamatábra segítséget nyújt az igényeinek megfelelő beszédfelismerési szolgáltatás kiválasztásában:
A diagram bal oldalán a hang-hang vagy a szöveggé alakítás folyamata látható.
- A beszédfelolvasás a hangforrás beszédének szövegformátumúvá alakítására szolgál.
- A beszédfelolvasás az egyik nyelv beszédének egy másik nyelven történő fordítására szolgál.
A diagram jobb oldalán a szöveg-hang folyamatok láthatók.
- A szövegfelolvasással kimondott hangokat hozhat létre szövegforrásból.
Gyakori használati helyzetek
Az alábbi táblázat szolgáltatásokat javasol néhány gyakori használati esethez.
Használati eset | Használandó szolgáltatás |
---|---|
Feliratok megadása rögzített vagy élő videókhoz | Diktálás |
Telefonhívás vagy értekezlet átiratának létrehozása | Diktálás |
Automatizált jegyzetdiktálás implementálása | Diktálás |
További feldolgozásra szánt felhasználói bevitel meghatározása | Diktálás |
A felhasználói bevitelre adott szóbeli válaszok létrehozása | Szövegfelolvasás |
Hangmenük létrehozása telefonrendszerekhez | Szövegfelolvasás |
E-mailek vagy sms-ek felolvasása kéz nélküli forgatókönyvekben | Szövegfelolvasás |
Közlemények közvetítése nyilvános helyeken, például vasútállomásokon vagy repülőtereken | Szövegfelolvasás |
Valós idejű feliratozás készítése beszédhez vagy egy beszélt beszélgetés egyidejű kétirányú fordításához | Diktálás |
Közreműködők
Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.
Fő szerzők:
- Kruti Mehta | Az Azure vezető Fast-Track mérnöke
- Oscar Shimabukuro | Vezető felhőmegoldás-tervező
Egyéb közreműködők:
- Mick Alberts | Műszaki író
- Ashish Chahuan | Vezető felhőmegoldás-tervező
- Brandon Cowen | Vezető felhőmegoldás-tervező
- Manjit Singh | Szoftvermérnök
- Christina Skarpathiotaki | Vezető felhőmegoldás-tervező
- Nathan Widdup | Az Azure vezető Fast-Track mérnöke
A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.
Következő lépések
- Mi az a beszédszolgáltatás?
- Speech API-k blogbejegyzése
- Képzési terv: Az Azure Cognitive Services kiépítése és kezelése
- Képzési terv: Beszéd feldolgozása és fordítása az Azure Cognitive Speech Services használatával
Kapcsolódó források (lehet, hogy a cikkek angol nyelvűek)
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: