Bevezetés
Az Azure AI Speech olyan API-kat biztosít, amelyekkel beszédalapú alkalmazásokat hozhat létre. Ide tartoznak az alábbiak:
- Beszéd–szöveg: Olyan API, amely lehetővé teszi a beszédfelismerést , amelyben az alkalmazás elfogadhatja a beszélt bemenetet.
- Szövegről beszédre: Olyan API, amely lehetővé teszi a beszédszintézist , amelyben az alkalmazás képes beszédkimenetet biztosítani.
- Beszédfordítás: Olyan API, amellyel a beszélt bemenetet több nyelvre is lefordíthatja.
- Speaker Recognition: Egy API, amely lehetővé teszi az alkalmazás számára, hogy felismerje az egyes hangszórókat a hangjuk alapján.
- Szándékfelismerés: Olyan API, amely beszélgetési nyelvfelismeréssel határozza meg a beszélt bemenet szemantikai jelentését.
Ez a modul a beszédfelismerésre és a beszédszintézisre összpontosít, amelyek a beszédalapú alkalmazások alapvető képességei.
Ebben a modulban a következőket sajátíthatja el:
- Azure-erőforrás kiépítése az Azure AI Speech szolgáltatáshoz
- Beszédfelismerés implementálása a Speech to text API használatával
- Beszédszintézis implementálása a Text to Speech API használatával
- Hangformátum és hangok konfigurálása
- Beszédszintézis korrektúranyelv (SSML) használata
A modul egységei fontos elméleti információkat tartalmaznak az Azure AI Speechről, valamint arról, hogyan használhatja az API-t az egyik támogatott szoftverfejlesztői készleten (SDK-n) keresztül, amely után gyakorlati gyakorlatban kipróbálhatja az Azure AI Speechet. A gyakorlati gyakorlat elvégzéséhez Microsoft Azure-előfizetésre lesz szüksége. Ha még nem rendelkezik előfizetéssel, regisztrálhat az ingyenes próbaverzióra a következő címen:https://azure.com/free.