A beszéd API-szolgáltatások típusai

Cikk
07/23/2024

Az Azure AI Speech szolgáltatással beszédalapú nyelvi átalakításokat hajthat végre, beleértve a beszédfelolvasást, a szövegfelolvasást, a beszédfordítást és a beszélőfelismerést.

Feljegyzés

Használja az Azure Cognitive Service for Language szolgáltatást, ha kifejezésekkel vagy kifejezésekkel kapcsolatos megállapításokat szeretne gyűjteni, vagy részletes környezeti elemzést szeretne kapni a beszélt vagy az írott nyelvről.

Szolgáltatások

A beszédfelolvasás valós időben vagy kötegben képes szöveggé alakítani a hangstreameket.
A szövegfelolvasás lehetővé teszi, hogy az alkalmazások emberi beszédgé alakítsák a szöveget.
A beszédfordítás többnyelvű beszéd- és szövegfordítást biztosít a hangstreamek számára.

Beszédszolgáltatás kiválasztása

Ez a folyamatábra segít kiválasztani az igényeinek megfelelő beszédszolgáltatást:

Beszédszolgáltatás kiválasztását bemutató ábra.

A diagram bal oldalán hang-hang- vagy hang-szöveg folyamatok láthatóak.

A beszéd szöveggé alakítása hangforrásból szövegformátummá.
A beszédfelolvasás az egyik nyelv beszédének egy másik nyelven történő fordítására szolgál.

A diagram jobb oldalán szöveg-hang folyamatok láthatóak.

A szövegfelolvasás a szöveges forrásból származó beszélt hang létrehozására szolgál.

Gyakori alkalmazási helyzetek

Az alábbi táblázat szolgáltatásokat javasol néhány gyakori használati esethez.

Használati eset	Használandó szolgáltatás
Feliratokat adhat meg rögzített vagy élő videókhoz	Beszédfelismerés
Telefonhívás vagy értekezlet átiratának létrehozása	Beszédfelismerés
Automatizált jegyzet diktálás implementálása	Beszédfelismerés
További feldolgozásra szánt felhasználói bevitel meghatározása	Beszédfelismerés
A felhasználói bemenetre adott szóbeli válaszok létrehozása	Szövegfelolvasás
Hangmenük létrehozása telefonos rendszerekhez	Szövegfelolvasás
E-mailek vagy szöveges üzenetek felolvasása kéz nélküli forgatókönyvekben	Szövegfelolvasás
Közlemények közvetítése nyilvános helyeken, például vasútállomásokon vagy repülőtereken	Szövegfelolvasás
Valós idejű feliratozás készítése beszédhez vagy egy beszélt beszélgetés egyidejű kétirányú fordításához	Beszédfelismerés

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerzők:

Kruti Mehta | Az Azure vezető gyorskövetési mérnöke
Oscar Shimabukuro | Vezető felhőmegoldás-tervező

Egyéb közreműködők:

Mick Alberts | Műszaki író
Ashish Chahuan | Vezető felhőmegoldás-tervező
Brandon Cowen | Vezető felhőmegoldás-tervező
Manjit Singh | Szoftvermérnök
Christina Skarpathiotaki | Vezető felhőmegoldás-tervező
Nathan Widdup | Az Azure vezető gyorskövetési mérnöke

A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.

Megosztás a következőn keresztül:

A beszéd API-szolgáltatások típusai

Szolgáltatások

Beszédszolgáltatás kiválasztása

Gyakori alkalmazási helyzetek

Közreműködők

Következő lépések

Visszajelzés

Visszajelzés

További források

Megosztás a következőn keresztül:

A beszéd API-szolgáltatások típusai

Szolgáltatások

Beszédszolgáltatás kiválasztása

Gyakori alkalmazási helyzetek

Közreműködők

Következő lépések

Kapcsolódó erőforrások

Visszajelzés

Visszajelzés

További források