Skapa ett tal till textprogram för kontinuerlig igenkänning

Slutförd

I föregående övning lärde du dig att skapa ett program som använde enkel igenkänning för att transkribera korta ljudfiler. Det här programmet fungerade bra för de korta ljudmemorandum som dina medicinska klienter tillhandahöll, men ditt företag behöver ett program som du kan använda för att transkribera dina klienters längre dikteringsfiler.

Med det i åtanke ändrar du i nästa övning ditt befintliga program så att det använder kontinuerlig igenkänning, vilket fungerar både för korta anteckningar och längre dikteringar. Kontinuerlig igenkänning ger dig större kontroll över taligenkänningsprocessen, men det krävs mer kod för att implementera i ditt program.

Skapa ett program med kontinuerlig igenkänning för att transkribera ljudfiler

Om du vill skapa ett program som konverterar tal till text med kontinuerlig igenkänning av Azure AI Speech måste programmet utföra alla följande uppgifter:

  • Microsoft.CognitiveServices.Speech Inkludera paketet.

  • Skapa en SpeechConfig klass med hjälp av API-nyckeln från ditt Azure AI-tjänstkonto.

  • Skapa en AudioConfig klass med en WAVE-fil som källa.

  • Skapa en SpeechRecognizer klass med klasserna SpeechConfig och AudioConfig .

  • Prenumerera på följande händelser i SpeechRecognizer klassen:

    • Händelsen Recognized identifierar om text har identifierats.
    • Händelsen Canceled identifierar om igenkänningen har avbrutits, vilket kan bero på ett fel.
    • Händelsen SessionStopped identifierar när igenkänningen har stoppats.
  • Skapa en StreamWriter klass för att skriva den konverterade texten till en fil.

  • StartContinuousRecognitionAsync() Anropa metoden för SpeechRecognizer klassen för att starta igenkänningen StopContinuousRecognitionAsync() och metoden för att stoppa igenkänningen.

I nästa övning ska vi titta närmare på alla dessa steg.