Bevezetés

2 perc

Az Azure AI Speech olyan API-kat biztosít, amelyekkel beszédalapú alkalmazásokat hozhat létre. Ide tartoznak az alábbiak:

Beszéd–szöveg: Olyan API, amely lehetővé teszi a beszédfelismerést , amelyben az alkalmazás elfogadhatja a beszélt bemenetet.
Szövegről beszédre: Olyan API, amely lehetővé teszi a beszédszintézist , amelyben az alkalmazás képes beszédkimenetet biztosítani.
Beszédfordítás: Olyan API, amellyel a beszélt bemenetet több nyelvre is lefordíthatja.
Speaker Recognition: Egy API, amely lehetővé teszi az alkalmazás számára, hogy felismerje az egyes hangszórókat a hangjuk alapján.
Szándékfelismerés: Olyan API, amely beszélgetési nyelvfelismeréssel határozza meg a beszélt bemenet szemantikai jelentését.

Ez a modul a beszédfelismerésre és a beszédszintézisre összpontosít, amelyek a beszédalapú alkalmazások alapvető képességei.

Ebben a modulban a következőket sajátíthatja el:

Azure-erőforrás kiépítése az Azure AI Speech szolgáltatáshoz
Beszédfelismerés implementálása a Speech to text API használatával
Beszédszintézis implementálása a Text to Speech API használatával
Hangformátum és hangok konfigurálása
Beszédszintézis korrektúranyelv (SSML) használata

A modul egységei fontos elméleti információkat tartalmaznak az Azure AI Speechről, valamint arról, hogyan használhatja az API-t az egyik támogatott szoftverfejlesztői készleten (SDK-n) keresztül, amely után gyakorlati gyakorlatban kipróbálhatja az Azure AI Speechet. A gyakorlati gyakorlat elvégzéséhez Microsoft Azure-előfizetésre lesz szüksége. Ha még nem rendelkezik előfizetéssel, regisztrálhat az ingyenes próbaverzióra a következő címen:https://azure.com/free.

Folytatás

Bevezetés

Visszajelzés