Inledning

Slutförd

Azure Speech i Foundry Tools innehåller API:er som du kan använda för att skapa talaktiverade program, inklusive:

  • Tal till text: Ett API som möjliggör taligenkänning där ditt program kan acceptera talade indata.
  • Text till tal: Ett API som möjliggör talsyntes där ditt program kan tillhandahålla talade utdata.
  • Talöversättning: Ett API som du kan använda för att översätta talade indata till flera språk.
  • Voice Live: Ett API som du kan använda för att skapa AI-agenter som kan föra realtidskonversationer.

Den här modulen fokuserar på taligenkänning och talsyntes, som är kärnfunktioner i alla talaktiverade program.

Kodexemplen i den här modulen finns i Python, men du kan använda något av de tillgängliga Azure Speech SDK-paketen för att utveckla talaktiverade program på önskat språk. Tillgängliga SDK-paket är:

Observera

Vi inser att olika personer gillar att lära sig på olika sätt. Du kan välja att slutföra den här modulen i videobaserat format eller läsa innehållet som text och bilder. Texten innehåller mer detaljer än videorna, så i vissa fall kanske du vill referera till den som kompletterande material till videopresentationen.