Inledning
Azure Speech i Foundry Tools innehåller API:er som du kan använda för att skapa talaktiverade program, inklusive:
- Tal till text: Ett API som möjliggör taligenkänning där ditt program kan acceptera talade indata.
- Text till tal: Ett API som möjliggör talsyntes där ditt program kan tillhandahålla talade utdata.
- Talöversättning: Ett API som du kan använda för att översätta talade indata till flera språk.
- Voice Live: Ett API som du kan använda för att skapa AI-agenter som kan föra realtidskonversationer.
Den här modulen fokuserar på taligenkänning och talsyntes, som är kärnfunktioner i alla talaktiverade program.
Kodexemplen i den här modulen finns i Python, men du kan använda något av de tillgängliga Azure Speech SDK-paketen för att utveckla talaktiverade program på önskat språk. Tillgängliga SDK-paket är:
Observera
Vi inser att olika personer gillar att lära sig på olika sätt. Du kan välja att slutföra den här modulen i videobaserat format eller läsa innehållet som text och bilder. Texten innehåller mer detaljer än videorna, så i vissa fall kanske du vill referera till den som kompletterande material till videopresentationen.