Een spraaktoepassing voor spraak met één opname in tekst maken

5 minuten

In de vorige oefening hebt u geleerd hoe u een Azure AI-servicesaccount maakt met behulp van de Azure CLI. Nu u een Azure AI-servicesaccount hebt waarmee u kunt werken, kunt u beginnen met het werken aan uw spraak-naar-teksttoepassing.

Uw eerste uitdaging is het maken van een toepassing die uw bedrijf kan gebruiken om de korte memo's van uw medische klanten te transcriberen. Azure AI-services bieden twee verschillende soorten spraakherkenning die u kunt gebruiken voor uw ontwikkeling:

Herkenning met één opname
- Herkenning met één opname luistert naar een pauze in de audio en stopt met herkennen en verwerkt slechts een maximum van 15 seconden audio.
- Dit type erkenning werkt goed voor de korte memo's die de medische klanten van uw bedrijf bieden, maar het werkt niet voor de langere dicteren.
- Herkenning met één opname is eenvoudiger te implementeren in uw toepassing, maar u hebt minder controle.
Continue herkenning
- Continue herkenning blijft luisteren totdat de herkenning is gestopt.
- Dit type herkenning werkt goed voor zowel de korte memo's als langere dicteren.
- Continue herkenning vereist meer code om te implementeren in uw toepassing, maar u hebt meer controle.

In de volgende oefening gebruikt u eenmalige herkenning om een toepassing te maken die u kunt gebruiken om de korte memo's van de medische klanten van uw bedrijf te transcriberen. Verderop in deze module gebruikt u continue herkenning om een toepassing te maken die u kunt gebruiken om zowel de korte memo's als langere dicteren te transcriberen.

Een toepassing maken met eenmalige herkenning om audiobestanden te transcriberen

Als u een toepassing wilt maken waarmee spraak naar tekst wordt geconverteerd met behulp van eenmalige herkenning van Azure AI Speech, moet uw toepassing alle volgende taken uitvoeren:

Neem het Microsoft.CognitiveServices.Speech pakket op.
Maak een SpeechConfig klasse met behulp van de API-sleutel van uw Azure AI-servicesaccount.
Maak een AudioConfig klasse met behulp van een WAVE-bestand als bron.
Maak een SpeechRecognizer klasse met behulp van de SpeechConfig en AudioConfig klassen.
Roep de RecognizeOnceAsync() methode van de SpeechRecognizer klasse aan om de spraak naar tekst te converteren.
Maak een StreamWriter klasse om de geconverteerde tekst naar een bestand te schrijven.

In de volgende oefening bekijken we al deze stappen in detail.

Doorgaan

Een toepassing maken met eenmalige herkenning om audiobestanden te transcriberen

Feedback