Wat is een spraakassistent?

Artikel
01/22/2024

Door spraakassistenten te gebruiken met de Speech-service kunnen ontwikkelaars natuurlijke, menselijke, gespreksinterfaces maken voor hun toepassingen en ervaringen. De spraakassistentservice biedt snelle, betrouwbare interactie tussen een apparaat en een assistent-implementatie.

Een assistentoplossing kiezen

De eerste stap bij het maken van een spraakassistent is om te bepalen wat u wilt doen. Speech Service biedt meerdere, complementaire oplossingen voor het maken van assistentinteracties. Misschien wilt u dat uw toepassing ondersteuning biedt voor een open gesprek met woordgroepen zoals 'Ik moet naar Seattle gaan' of 'Wat voor soort pizza kan ik bestellen?' Voor flexibiliteit en veelzijdigheid kunt u spraak- en spraakmogelijkheden toevoegen aan een bot met behulp van Azure AI Bot Service met het Direct Line Speech-kanaal .

Als u nog niet zeker weet wat uw assistent moet doen, raden we Direct Line Speech aan als de beste optie. Het biedt integratie met een uitgebreide set hulpprogramma's en ontwerphulpmiddelen, zoals de virtual assistant-oplossing en de ondernemingssjabloon en de QnA Maker-service, om voort te bouwen op algemene patronen en uw bestaande kennisbronnen te gebruiken.

Referentiearchitectuur voor het bouwen van een spraakassistent met behulp van de Speech SDK

Conceptual diagram of the voice assistant orchestration service flow.

Kernfuncties

Of u nu Direct Line Speech of een andere oplossing kiest om uw assistentinteracties te maken, u kunt een uitgebreide set aanpassingsfuncties gebruiken om uw assistent aan te passen aan uw merk, product en persoonlijkheid.

Categorie	Functies
Aangepast trefwoord	Gebruikers kunnen gesprekken met assistenten starten met behulp van een aangepast trefwoord zoals 'Hey Contoso'. Een app doet dit met een aangepaste trefwoordenengine in de Speech SDK, die u kunt configureren door aan de slag te gaan met aangepaste trefwoorden. Spraakassistenten kunnen trefwoordverificatie aan de servicezijde gebruiken om de nauwkeurigheid van de activering van trefwoorden te verbeteren (in plaats van alleen het apparaat te gebruiken).
Spraak naar tekst	Spraakassistenten converteren realtime audio naar herkende tekst met behulp van spraak naar tekst van de Speech-service. Deze tekst is beschikbaar, omdat deze wordt getranscribeerd, voor zowel uw assistentimplementatie als uw clienttoepassing.
Tekst naar spraak	Tekstuele antwoorden van uw assistent worden gesynthetiseerd via tekst naar spraak van de Speech-service. Deze synthese wordt vervolgens beschikbaar gesteld aan uw clienttoepassing als een audiostream. Microsoft biedt de mogelijkheid om uw eigen aangepaste, hoogwaardige neurale tekst naar spraak (neurale TTS) spraak te bouwen die uw merk een stem geeft.

Aan de slag met spraakassistenten

We bieden het volgende quickstart-artikel dat is ontworpen om u in minder dan 10 minuten code uit te voeren: Quickstart: Een aangepaste spraakassistent maken met Direct Line Speech

Voorbeeldcode en zelfstudies

Voorbeeldcode voor het maken van een spraakassistent is beschikbaar op GitHub. De voorbeelden hebben betrekking op de clienttoepassing voor het maken van verbinding met uw assistent in verschillende populaire programmeertalen.

Aanpassing

Spraakassistenten die u bouwt met behulp van de Speech-service, kunnen gebruikmaken van een volledig scala aan aanpassingsopties.

Notitie

Aanpassingsopties variëren per taal en landinstelling. Zie Ondersteunde talen voor meer informatie.