Administrar los problemas con la entrada de audio

Artículo
06/02/2023

Aprende a administrar los problemas con la precisión del reconocimiento de voz causados por la calidad de la entrada de audio.

API importantes: SpeechRecognizer, RecognitionQualityDegrading, SpeechRecognitionAudioProblem

Evaluar la calidad de entrada de audio

Cuando el reconocimiento de voz esté activado, usa el evento RecognitionQualityDegrading del reconocedor de voz para determinar si uno o más problemas de audio pueden interferir con la entrada de voz. El argumento de evento (SpeechRecognitionQualityDegradingEventArgs) proporciona la propiedad Problem, que describe los problemas detectados con la entrada de audio.

El reconocimiento puede verse afectado si hay demasiado ruido de fondo, un micrófono silenciado o por el volumen o la velocidad del altavoz.

Aquí se configura un reconocedor de voz y se comienza a escuchar el evento RecognitionQualityDegrading.

private async void WeatherSearch_Click(object sender, RoutedEventArgs e)
{
    // Create an instance of SpeechRecognizer.
    var speechRecognizer = new Windows.Media.SpeechRecognition.SpeechRecognizer();

    // Listen for audio input issues.
    speechRecognizer.RecognitionQualityDegrading += speechRecognizer_RecognitionQualityDegrading;

    // Add a web search grammar to the recognizer.
    var webSearchGrammar = new Windows.Media.SpeechRecognition.SpeechRecognitionTopicConstraint(Windows.Media.SpeechRecognition.SpeechRecognitionScenario.WebSearch, "webSearch");


    speechRecognizer.UIOptions.AudiblePrompt = "Say what you want to search for...";
    speechRecognizer.UIOptions.ExampleText = "Ex. 'weather for London'";
    speechRecognizer.Constraints.Add(webSearchGrammar);

    // Compile the constraint.
    await speechRecognizer.CompileConstraintsAsync();

    // Start recognition.
    Windows.Media.SpeechRecognition.SpeechRecognitionResult speechRecognitionResult = await speechRecognizer.RecognizeWithUIAsync();
    //await speechRecognizer.RecognizeWithUIAsync();

    // Do something with the recognition result.
    var messageDialog = new Windows.UI.Popups.MessageDialog(speechRecognitionResult.Text, "Text spoken");
    await messageDialog.ShowAsync();
}

Administrar la experiencia de reconocimiento de voz

Usa la descripción que proporciona la propiedad Problem para ayudar al usuario a mejorar las condiciones de reconocimiento.

A continuación, se crea un controlador para el evento RecognitionQualityDegrading que comprueba si hay un nivel de volumen bajo. Luego, se usa un objeto SpeechSynthesizer para sugerir que el usuario hable más alto.

private async void speechRecognizer_RecognitionQualityDegrading(
    Windows.Media.SpeechRecognition.SpeechRecognizer sender,
    Windows.Media.SpeechRecognition.SpeechRecognitionQualityDegradingEventArgs args)
{
    // Create an instance of a speech synthesis engine (voice).
    var speechSynthesizer =
        new Windows.Media.SpeechSynthesis.SpeechSynthesizer();

    // If input speech is too quiet, prompt the user to speak louder.
    if (args.Problem == Windows.Media.SpeechRecognition.SpeechRecognitionAudioProblem.TooQuiet)
    {
        // Generate the audio stream from plain text.
        Windows.Media.SpeechSynthesis.SpeechSynthesisStream stream;
        try
        {
            stream = await speechSynthesizer.SynthesizeTextToStreamAsync("Try speaking louder");
            stream.Seek(0);
        }
        catch (Exception)
        {
            stream = null;
        }

        // Send the stream to the MediaElement declared in XAML.
        await CoreApplication.MainView.CoreWindow.Dispatcher.RunAsync(Windows.UI.Core.CoreDispatcherPriority.High, () =>
        {
            this.media.SetSource(stream, stream.ContentType);
        });
    }
}

Interacciones de voz

Muestras

Muestra de reconocimiento de voz y síntesis de voz

Administrar los problemas con la entrada de audio

Evaluar la calidad de entrada de audio

Administrar la experiencia de reconocimiento de voz

Comentarios

Recursos adicionales

Administrar los problemas con la entrada de audio

Evaluar la calidad de entrada de audio

Administrar la experiencia de reconocimiento de voz

Artículos relacionados

Comentarios

Recursos adicionales