Een spraaktoepassing voor spraak met één opname in tekst maken
In de vorige oefening hebt u geleerd hoe u een Azure AI-servicesaccount maakt met behulp van de Azure CLI. Nu u een Azure AI-servicesaccount hebt waarmee u kunt werken, kunt u beginnen met het werken aan uw spraak-naar-teksttoepassing.
Uw eerste uitdaging is het maken van een toepassing die uw bedrijf kan gebruiken om de korte memo's van uw medische klanten te transcriberen. Azure AI-services bieden twee verschillende soorten spraakherkenning die u kunt gebruiken voor uw ontwikkeling:
Herkenning met één opname
Herkenning met één opname luistert naar een pauze in de audio en stopt met herkennen en verwerkt slechts een maximum van 15 seconden audio.
Dit type erkenning werkt goed voor de korte memo's die de medische klanten van uw bedrijf bieden, maar het werkt niet voor de langere dicteren.
Herkenning met één opname is eenvoudiger te implementeren in uw toepassing, maar u hebt minder controle.
Continue herkenning
Continue herkenning blijft luisteren totdat de herkenning is gestopt.
Dit type herkenning werkt goed voor zowel de korte memo's als langere dicteren.
Continue herkenning vereist meer code om te implementeren in uw toepassing, maar u hebt meer controle.
In de volgende oefening gebruikt u eenmalige herkenning om een toepassing te maken die u kunt gebruiken om de korte memo's van de medische klanten van uw bedrijf te transcriberen. Verderop in deze module gebruikt u continue herkenning om een toepassing te maken die u kunt gebruiken om zowel de korte memo's als langere dicteren te transcriberen.
Een toepassing maken met eenmalige herkenning om audiobestanden te transcriberen
Als u een toepassing wilt maken waarmee spraak naar tekst wordt geconverteerd met behulp van eenmalige herkenning van Azure AI Speech, moet uw toepassing alle volgende taken uitvoeren:
Neem het
Microsoft.CognitiveServices.Speech
pakket op.Maak een
SpeechConfig
klasse met behulp van de API-sleutel van uw Azure AI-servicesaccount.Maak een
AudioConfig
klasse met behulp van een WAVE-bestand als bron.Maak een
SpeechRecognizer
klasse met behulp van deSpeechConfig
enAudioConfig
klassen.Roep de
RecognizeOnceAsync()
methode van deSpeechRecognizer
klasse aan om de spraak naar tekst te converteren.Maak een
StreamWriter
klasse om de geconverteerde tekst naar een bestand te schrijven.
In de volgende oefening bekijken we al deze stappen in detail.