A beszéd API-szolgáltatások típusai
Az Azure AI Speech szolgáltatással beszédalapú nyelvi átalakításokat hajthat végre, beleértve a beszédfelolvasást, a szövegfelolvasást, a beszédfordítást és a beszélőfelismerést.
Feljegyzés
Használja az Azure Cognitive Service for Language szolgáltatást, ha kifejezésekkel vagy kifejezésekkel kapcsolatos megállapításokat szeretne gyűjteni, vagy részletes környezeti elemzést szeretne kapni a beszélt vagy az írott nyelvről.
Szolgáltatások
- A beszédfelolvasás valós időben vagy kötegben képes szöveggé alakítani a hangstreameket.
- A szövegfelolvasás lehetővé teszi, hogy az alkalmazások emberi beszédgé alakítsák a szöveget.
- A beszédfordítás többnyelvű beszéd- és szövegfordítást biztosít a hangstreamek számára.
Beszédszolgáltatás kiválasztása
Ez a folyamatábra segít kiválasztani az igényeinek megfelelő beszédszolgáltatást:
A diagram bal oldalán hang-hang- vagy hang-szöveg folyamatok láthatóak.
- A beszéd szöveggé alakítása hangforrásból szövegformátummá.
- A beszédfelolvasás az egyik nyelv beszédének egy másik nyelven történő fordítására szolgál.
A diagram jobb oldalán szöveg-hang folyamatok láthatóak.
- A szövegfelolvasás a szöveges forrásból származó beszélt hang létrehozására szolgál.
Gyakori alkalmazási helyzetek
Az alábbi táblázat szolgáltatásokat javasol néhány gyakori használati esethez.
Használati eset | Használandó szolgáltatás |
---|---|
Feliratokat adhat meg rögzített vagy élő videókhoz | Beszédfelismerés |
Telefonhívás vagy értekezlet átiratának létrehozása | Beszédfelismerés |
Automatizált jegyzet diktálás implementálása | Beszédfelismerés |
További feldolgozásra szánt felhasználói bevitel meghatározása | Beszédfelismerés |
A felhasználói bemenetre adott szóbeli válaszok létrehozása | Szövegfelolvasás |
Hangmenük létrehozása telefonos rendszerekhez | Szövegfelolvasás |
E-mailek vagy szöveges üzenetek felolvasása kéz nélküli forgatókönyvekben | Szövegfelolvasás |
Közlemények közvetítése nyilvános helyeken, például vasútállomásokon vagy repülőtereken | Szövegfelolvasás |
Valós idejű feliratozás készítése beszédhez vagy egy beszélt beszélgetés egyidejű kétirányú fordításához | Beszédfelismerés |
Közreműködők
Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.
Fő szerzők:
- Kruti Mehta | Az Azure vezető gyorskövetési mérnöke
- Oscar Shimabukuro | Vezető felhőmegoldás-tervező
Egyéb közreműködők:
- Mick Alberts | Műszaki író
- Ashish Chahuan | Vezető felhőmegoldás-tervező
- Brandon Cowen | Vezető felhőmegoldás-tervező
- Manjit Singh | Szoftvermérnök
- Christina Skarpathiotaki | Vezető felhőmegoldás-tervező
- Nathan Widdup | Az Azure vezető gyorskövetési mérnöke
A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.
Következő lépések
- Mi a Speech szolgáltatás?
- Speech API-k blogbejegyzése
- Képzési terv: Az Azure Cognitive Services kiépítése és kezelése
- Képzési terv: Beszéd feldolgozása és fordítása az Azure Cognitive Speech Services használatával
Kapcsolódó erőforrások
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: