Wat is een spraakassistent?
Door spraakassistenten te gebruiken met de Speech-service kunnen ontwikkelaars natuurlijke, menselijke, gespreksinterfaces maken voor hun toepassingen en ervaringen. De spraakassistentservice biedt een snelle, betrouwbare interactie tussen een apparaat en een assistent-implementatie.
Een assistent-oplossing kiezen
De eerste stap bij het maken van een spraakassistent is om te bepalen wat u wilt dat deze doet. Spraakservice biedt meerdere, aanvullende oplossingen voor het maken van assistentinteracties. Mogelijk wilt u dat uw toepassing ondersteuning biedt voor een open gesprek met zinnen zoals 'Ik moet naar Seattle' of 'Wat voor pizza kan ik bestellen?' Voor flexibiliteit en veelzijdigheid kunt u mogelijkheden voor inspraak en voice-out toevoegen aan een bot met behulp van Azure Bot Service met het Direct Line Speech-kanaal.
Als u nog niet zeker weet wat u wilt dat uw assistent doet, raden we u aan spraak te Direct Line als de beste optie. Het biedt integratie met een uitgebreide set hulpprogramma's en ontwerphulpmiddelen, zoals de virtuele assistent-oplossing en de ondernemingssjabloon en de QnA Maker-service, om voort te bouwen op algemene patronen en uw bestaande kennisbronnen te gebruiken.
Referentiearchitectuur voor het bouwen van een spraakassistent met behulp van de Speech SDK
Kernfuncties
Of u nu kiest voor Direct Line Speech of een andere oplossing om uw assistent-interacties te maken, u kunt een uitgebreide set aanpassingsfuncties gebruiken om uw assistent aan te passen aan uw merk, product en persoonlijkheid.
Categorie | Functies |
---|---|
Aangepast trefwoord | Gebruikers kunnen gesprekken met assistenten starten met behulp van een aangepast trefwoord, zoals 'Hey Contoso'. Een app doet dit met een aangepaste trefwoordenengine in de Speech SDK, die u kunt configureren door naar Aan de slag met aangepaste trefwoorden te gaan. Spraakassistenten kunnen trefwoordverificatie aan de servicezijde gebruiken om de nauwkeurigheid van de trefwoordactivering te verbeteren (in plaats van alleen het apparaat te gebruiken). |
Spraak-naar-tekst | Spraakassistenten converteren realtime audio naar herkende tekst met behulp van spraak naar tekst van de Speech-service. Deze tekst is beschikbaar, terwijl deze wordt getranscribeerd, voor zowel uw assistentimplementatie als uw clienttoepassing. |
Tekst-naar-spraak | Tekstuele antwoorden van uw assistent worden gesynthetiseerd via tekst-naar-spraak van de Speech-service. Deze synthese wordt vervolgens beschikbaar gesteld aan uw clienttoepassing als een audiostream. Microsoft biedt de mogelijkheid om uw eigen aangepaste, hoogwaardige neurale TTS-stem (neurale tekst naar spraak) te maken die uw merk een stem geeft. |
Aan de slag met spraakassistenten
We bieden het volgende quickstart-artikel dat is ontworpen om code in minder dan 10 minuten uit te voeren: Quickstart: Een aangepaste spraakassistent maken met behulp van Direct Line Speech
Voorbeeldcode en zelfstudies
Voorbeeldcode voor het maken van een spraakassistent is beschikbaar op GitHub. De voorbeelden hebben betrekking op de clienttoepassing voor het maken van verbinding met uw assistent in verschillende populaire programmeertalen.
- Voorbeelden van spraakassistenten op GitHub
- Zelfstudie: Spraak inschakelen van een assistent die is gebouwd met behulp van Azure Bot Service met de C# Speech SDK
Aanpassing
Spraakassistenten die u bouwt met behulp van de Speech-service, kunnen gebruikmaken van een volledig scala aan aanpassingsopties.
Notitie
Aanpassingsopties variƫren per taal en landinstelling. Zie Ondersteunde talen voor meer informatie.