SpeechRecognizer Clase

Definición

Transcribe la voz en texto. La voz puede llegar a través del micrófono, el archivo de audio u otra secuencia de entrada de audio.

public sealed class SpeechRecognizer : Microsoft.CognitiveServices.Speech.Recognizer
type SpeechRecognizer = class
    inherit Recognizer
Public NotInheritable Class SpeechRecognizer
Inherits Recognizer
Herencia
SpeechRecognizer

Ejemplos

En este ejemplo se usa el reconocedor de voz de un micrófono y se escuchan los eventos generados por el reconocedor.

public async Task SpeechContinuousRecognitionAsync()
{
    // Creates an instance of a speech config with specified subscription key and region.
    // Replace with your own subscription key and service region (e.g., "westus").
    var config = SpeechConfig.FromSubscription("YourSubscriptionKey", "YourServiceRegion");

    // Creates a speech recognizer from microphone.
    using (var recognizer = new SpeechRecognizer(config))
    {
        // Subscribes to events.
        recognizer.Recognizing += (s, e) => {
            Console.WriteLine($"RECOGNIZING: Text={e.Result.Text}");
        };

        recognizer.Recognized += (s, e) => {
            var result = e.Result;
            Console.WriteLine($"Reason: {result.Reason.ToString()}");
            if (result.Reason == ResultReason.RecognizedSpeech)
            {
                    Console.WriteLine($"Final result: Text: {result.Text}.");
            }
        };

        recognizer.Canceled += (s, e) => {
            Console.WriteLine($"\n    Canceled. Reason: {e.Reason.ToString()}, CanceledReason: {e.Reason}");
        };

        recognizer.SessionStarted += (s, e) => {
            Console.WriteLine("\n    Session started event.");
        };

        recognizer.SessionStopped += (s, e) => {
            Console.WriteLine("\n    Session stopped event.");
        };

        // Starts continuous recognition. 
        // Uses StopContinuousRecognitionAsync() to stop recognition.
        await recognizer.StartContinuousRecognitionAsync().ConfigureAwait(false);

        do
        {
            Console.WriteLine("Press Enter to stop");
        } while (Console.ReadKey().Key != ConsoleKey.Enter);

        // Stops recognition.
        await recognizer.StopContinuousRecognitionAsync().ConfigureAwait(false);
    }
}

Comentarios

Consulte también: Introducción a la conversión de voz en texto

Constructores

SpeechRecognizer(EmbeddedSpeechConfig)

Crea una nueva instancia de SpeechRecognizer mediante EmbeddedSpeechConfig, configurada para recibir voz del micrófono predeterminado. Agregado en la versión 1.19.0

SpeechRecognizer(EmbeddedSpeechConfig, AudioConfig)

Crea una nueva instancia de SpeechRecognizer mediante EmbeddedSpeechConfig, configurada para recibir voz de un origen de audio especificado en un objeto AudioConfig. Agregado en la versión 1.19.0

SpeechRecognizer(EmbeddedSpeechConfig, AutoDetectSourceLanguageConfig)

Crea una nueva instancia de SpeechRecognizer, mediante EmbeddedSpeechConfig, que determina el idioma de origen de una lista de opciones. Agregado en la versión 1.20.0

SpeechRecognizer(EmbeddedSpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)

Crea una nueva instancia de SpeechRecognizer, mediante EmbeddedSpeechConfig, que determina el idioma de origen de una lista de opciones. Agregado en la versión 1.20.0

SpeechRecognizer(HybridSpeechConfig)

Crea una nueva instancia de SpeechRecognizer mediante HybridSpeechConfig, configurada para recibir voz del micrófono predeterminado.

SpeechRecognizer(HybridSpeechConfig, AudioConfig)

Crea una nueva instancia de SpeechRecognizer mediante HybridSpeechConfig, configurada para recibir voz de un origen de audio especificado en un objeto AudioConfig.

SpeechRecognizer(HybridSpeechConfig, AutoDetectSourceLanguageConfig)

Crea una nueva instancia de SpeechRecognizer, mediante HybridSpeechConfig, que determina el idioma de origen de una lista de opciones.

SpeechRecognizer(HybridSpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)

Crea una nueva instancia de SpeechRecognizer, mediante HybridSpeechConfig, que determina el idioma de origen de una lista de opciones.

SpeechRecognizer(SpeechConfig)

Crea una nueva instancia de SpeechRecognizer configurada para recibir voz del micrófono predeterminado.

SpeechRecognizer(SpeechConfig, AudioConfig)

Crea una nueva instancia de SpeechRecognizer configurada para recibir voz de un origen de audio especificado en un objeto AudioConfig.

SpeechRecognizer(SpeechConfig, AutoDetectSourceLanguageConfig)

Crea una nueva instancia de SpeechRecognizer que determina el idioma de origen de una lista de opciones. Agregado en la versión 1.9.0

SpeechRecognizer(SpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)

Crea una nueva instancia de SpeechRecognizer. Agregado en la versión 1.9.0

SpeechRecognizer(SpeechConfig, SourceLanguageConfig)

Crea una nueva instancia de SpeechRecognizer. Agregado en la versión 1.9.0

SpeechRecognizer(SpeechConfig, SourceLanguageConfig, AudioConfig)

Crea una nueva instancia de SpeechRecognizer. Agregado en la versión 1.9.0

SpeechRecognizer(SpeechConfig, String)

Crea una nueva instancia de SpeechRecognizer configurada para recibir voz en un idioma determinado. Agregado en la versión 1.9.0

SpeechRecognizer(SpeechConfig, String, AudioConfig)

Crea una nueva instancia de SpeechRecognizer configurada para recibir voz en un idioma determinado de un origen de audio especificado en un objeto AudioConfig. Agregado en la versión 1.9.0

Campos

disposed

disposed es una marca que se usa para indicar si se elimina el objeto.

(Heredado de Recognizer)
gch

Identificador de GC para devoluciones de llamada para contexto.

(Heredado de Recognizer)
isDisposing

Indica si el objeto se está eliminando actualmente.

(Heredado de Recognizer)
pointerHandle

Interno para el registro.

(Heredado de Recognizer)
recognizerLock

recognizerLock se usa para sincronizar el acceso a variables miembro de objetos desde varios subprocesos

(Heredado de Recognizer)

Propiedades

AuthorizationToken

Obtiene o establece el token de autorización utilizado para comunicarse con el servicio.

Nota: El código debe asegurarse de que el token de autorización es válido. Antes de que expire el token de autorización, el código debe actualizarlo llamando a este establecedor con un nuevo token válido. De lo contrario, el reconocedor generará errores durante el reconocimiento.

EndpointId

Obtiene el identificador de punto de conexión de un modelo de voz personalizado que se va a usar para el reconocimiento de voz.

OutputFormat

Obtiene la configuración de formato de salida.

Properties

Colección de propiedades y sus valores definidos para este objeto SpeechRecognizer. Nota: La colección de propiedades solo es válida hasta que el reconocedor que posee estas propiedades se elimina o finaliza.

SpeechRecognitionLanguage

Obtiene el nombre de idioma que se estableció cuando se creó el reconocedor.

Métodos

Dispose()

Elimine los recursos asociados.

(Heredado de Recognizer)
Dispose(Boolean)

Este método realiza la limpieza de recursos. El parámetro disposing booleano indica si se llama al método desde Dispose() (si disposing es true) o desde el finalizador (si disposing es false). Las clases derivadas deben invalidar este método para eliminar el recurso si es necesario.

(Heredado de Recognizer)
Finalize()

Transcribe la voz en texto. La voz puede llegar a través del micrófono, el archivo de audio u otra secuencia de entrada de audio.

RecognizeOnceAsync()

Inicia el reconocimiento de voz como una operación asincrónica.

StartContinuousRecognitionAsync()

Inicia el reconocimiento de voz en una secuencia de audio continua como una operación asincrónica, hasta que se llama a StopContinuousRecognitionAsync(). Debe suscribirse a eventos para recibir resultados de reconocimiento.

StartKeywordRecognitionAsync(KeywordRecognitionModel)

Configura el reconocedor con el modelo de palabras clave especificado. Después de llamar a este método, el reconocedor escucha la palabra clave para iniciar el reconocimiento. Llame a StopKeywordRecognitionAsync() para finalizar el reconocimiento iniciado por la palabra clave. Debe suscribirse a eventos para recibir resultados de reconocimiento.

StopContinuousRecognitionAsync()

Detiene una operación de reconocimiento en ejecución tan pronto como sea posible y solicita inmediatamente un resultado en función de la entrada que se ha procesado hasta ahora. Esto funciona para todas las operaciones de reconocimiento, no solo para las continuas, y facilita el uso de botones push-to-talk o "finish now" para el punto de conexión de audio manual.

StopKeywordRecognitionAsync()

Finaliza el reconocimiento iniciado por la palabra clave.

Eventos

Canceled

El evento Canceled indica que se canceló el reconocimiento de voz.

Recognized

El evento Recognized indica que se recibe un resultado de reconocimiento final.

Recognizing

El evento Recognizing indica que se recibe un resultado intermedio de reconocimiento.

SessionStarted

Define el controlador de eventos para el evento iniciado por la sesión.

(Heredado de Recognizer)
SessionStopped

Define el controlador de eventos para el evento detenido de sesión.

(Heredado de Recognizer)
SpeechEndDetected

Define el controlador de eventos para el evento detectado del final de voz.

(Heredado de Recognizer)
SpeechStartDetected

Define el controlador de eventos para el evento detectado de inicio de voz.

(Heredado de Recognizer)

Se aplica a