Introduction

Voltooid

Azure Speech in Foundry Tools biedt spraak-naar-tekst- en tekst-naar-spraakmogelijkheden die u kunt integreren in AI-toepassingen. Met deze mogelijkheden kunt u audio transcriberen naar tekst en natuurlijk klinkende spraak uit tekst synthetiseren.

Hoewel u deze mogelijkheden rechtstreeks kunt aanroepen via de Speech SDK of REST API's, kunt u ze ook beschikbaar maken voor een AI-agent via de MCP-server (Azure Speech Model Context Protocol). Met deze methode kan de agent spraaktaken afhandelen op basis van de aanvraag voor natuurlijke taal van een gebruiker, zonder dat u specifieke code hoeft te schrijven voor elke spraakbewerking.

Stel dat u werkt voor een bedrijf dat klantondersteuningsoproepen moet verwerken. Uw team moet opgenomen oproepen transcriberen naar tekst voor analyse en audioreacties genereren die kunnen worden afgespeeld aan klanten. In plaats van afzonderlijke integraties te bouwen voor transcriptie en synthese, kunt u een AI-agent maken die gebruikmaakt van de Azure Speech MCP-server om beide taken uit te voeren via één hulpprogrammaverbinding.

In deze module leert u hoe de Azure Speech MCP-server werkt, hoe u deze verbindt met een AI-agent in Microsoft Foundry en hoe u een clienttoepassing bouwt die via een programma met de agent communiceert.

Opmerking

De Azure Speech MCP-server is momenteel beschikbaar als openbare preview. Details die in deze module worden beschreven, kunnen worden gewijzigd.