Megosztás a következőn keresztül:


A beszéd API-szolgáltatások típusai

Az Azure AI Speech szolgáltatással beszédalapú nyelvi átalakításokat hajthat végre, beleértve a beszédfelolvasást, a szövegfelolvasást, a beszédfordítást és a beszélőfelismerést.

Feljegyzés

Használja az Azure Cognitive Service for Language szolgáltatást, ha kifejezésekkel vagy kifejezésekkel kapcsolatos megállapításokat szeretne gyűjteni, vagy részletes környezeti elemzést szeretne kapni a beszélt vagy az írott nyelvről.

Szolgáltatások

  • A beszédfelolvasás valós időben vagy kötegben képes szöveggé alakítani a hangstreameket.
  • A szövegfelolvasás lehetővé teszi, hogy az alkalmazások emberi beszédgé alakítsák a szöveget.
  • A beszédfordítás többnyelvű beszéd- és szövegfordítást biztosít a hangstreamek számára.

Beszédszolgáltatás kiválasztása

Ez a folyamatábra segít kiválasztani az igényeinek megfelelő beszédszolgáltatást:

Beszédszolgáltatás kiválasztását bemutató ábra.

A diagram bal oldalán hang-hang- vagy hang-szöveg folyamatok láthatóak.

  • A beszéd szöveggé alakítása hangforrásból szövegformátummá.
  • A beszédfelolvasás az egyik nyelv beszédének egy másik nyelven történő fordítására szolgál.

A diagram jobb oldalán szöveg-hang folyamatok láthatóak.

  • A szövegfelolvasás a szöveges forrásból származó beszélt hang létrehozására szolgál.

Gyakori alkalmazási helyzetek

Az alábbi táblázat szolgáltatásokat javasol néhány gyakori használati esethez.

Használati eset Használandó szolgáltatás
Feliratokat adhat meg rögzített vagy élő videókhoz Beszédfelismerés
Telefonhívás vagy értekezlet átiratának létrehozása Beszédfelismerés
Automatizált jegyzet diktálás implementálása Beszédfelismerés
További feldolgozásra szánt felhasználói bevitel meghatározása Beszédfelismerés
A felhasználói bemenetre adott szóbeli válaszok létrehozása Szövegfelolvasás
Hangmenük létrehozása telefonos rendszerekhez Szövegfelolvasás
E-mailek vagy szöveges üzenetek felolvasása kéz nélküli forgatókönyvekben Szövegfelolvasás
Közlemények közvetítése nyilvános helyeken, például vasútállomásokon vagy repülőtereken Szövegfelolvasás
Valós idejű feliratozás készítése beszédhez vagy egy beszélt beszélgetés egyidejű kétirányú fordításához Beszédfelismerés

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerzők:

Egyéb közreműködők:

A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.

Következő lépések