Compartir a través de


Microsoft.CognitiveServices.Speech Espacio de nombres

Clases

AudioDataStream

Proporciona datos de audio como una secuencia. Agregado en la versión 1.4.0

AutoDetectSourceLanguageConfig

Configura opciones para la detección automática de idiomas. Actualizado en la versión 1.13.0

AutoDetectSourceLanguageResult

Contiene idiomas detectados por el servicio voz. Agregado en la versión 1.9.0

CancellationDetails

Contiene información detallada sobre por qué se canceló un resultado.

ClassLanguageModel

Representa una lista de gramáticas para escenarios de gramática dinámica. Agregado en la versión 1.7.0

Connection

Clase de proxy para administrar la conexión al servicio de voz del reconocedor especificado. Agregado en la versión 1.2.0

ConnectionEventArgs

Contiene la carga de eventos conectados o desconectados agregados en la versión 1.2.0.

ConnectionMessage

Representa los mensajes específicos de la implementación enviados y recibidos del servicio de voz. Solo para depuración. Agregado en la versión 1.10.0

ConnectionMessageEventArgs

Contiene la carga de los eventos MessageReceived de una instancia de Connection. Agregado en la versión 1.10.0

DetailedSpeechRecognitionResult

Contiene detalles de reconocimiento, como puntuación de confianza, texto reconocido, forma léxica sin formato, formulario normalizado y formulario normalizado con palabras soeces enmascaradas. Se ha cambiado en la versión 1.7.0

EmbeddedSpeechConfig

Clase que define la configuración de voz insertada (sin conexión).

Grammar

Representa la gramática de clases base para personalizar el reconocimiento de voz. Agregado en la versión 1.5.0

GrammarList

Representa una lista de gramáticas para escenarios de gramática dinámica. Agregado en la versión 1.7.0

GrammarPhrase

Representa una frase que el usuario puede hablar. Agregado en la versión 1.5.0

HybridSpeechConfig

Clase que define configuraciones híbridas (en la nube y insertadas) para el reconocimiento de voz y la síntesis de voz.

KeywordRecognitionEventArgs

Clase para los eventos emitidos por .KeywordRecognizer

KeywordRecognitionModel

Representa el modelo de reconocimiento de palabras clave que puede desencadenar un evento cuando se hablan palabras clave predefinidas.

KeywordRecognitionResult

Contiene los resultados emitidos por .KeywordRecognizer

KeywordRecognizer

Reconoce una palabra o frase corta mediante un modelo de palabra clave.

NoMatchDetails

Contiene información detallada para los resultados de reconocimiento de NoMatch.

PhonemeLevelTimingResult

Resultado de tiempo del nivel de phoneme. Agregado en la versión 1.14.0

PhraseListGrammar

Identifica frases conocidas en datos de audio. Agregado en la versión 1.5.0

PronunciationAssessmentNBestPhoneme

Resultado fonético de la evaluación de pronunciación nbest Agregado en 1.20.0

PropertyCollection

Clase para recuperar o establecer un valor de propiedad de una colección de propiedades.

RecognitionEventArgs

Contiene la carga de eventos de reconocimiento, como Inicio y finalización de voz detectados.

RecognitionResult

Contiene información detallada sobre el resultado de una operación de reconocimiento.

Recognizer

Clase base que contiene principalmente controladores de eventos comunes.

SessionEventArgs

Contiene la carga de SessionStarted los eventos y SessionStopped .

SourceLanguageConfig

Configuración del idioma de origen. Agregado en la versión 1.17.0

SourceLanguageRecognizer

Detecta el idioma hablado en el audio de entrada. Agregado en la versión 1.17.0

SpeechConfig

Información sobre la suscripción, incluida la clave y la región, el punto de conexión, el host o el token de autorización.

SpeechRecognitionCanceledEventArgs

Contiene la carga de eventos de resultados cancelados del reconocimiento de voz.

SpeechRecognitionEventArgs

Contiene la carga de los eventos de reconocimiento y reconocimiento de voz.

SpeechRecognitionModel

Información del modelo de reconocimiento de voz.

SpeechRecognitionResult

Contiene el resultado del reconocimiento de voz.

SpeechRecognitionResultExtensions

Métodos de extensión para el resultado del reconocimiento de voz

SpeechRecognizer

Transcribe la voz en texto. La voz puede llegar a través del micrófono, el archivo de audio u otra secuencia de entrada de audio.

SpeechSynthesisBookmarkEventArgs

Contiene el evento bookmark en voz sintetizada. Agregado en la versión 1.16.0

SpeechSynthesisCancellationDetails

Contiene información detallada sobre por qué se canceló un resultado de síntesis de voz. Agregado en la versión 1.4.0

SpeechSynthesisEventArgs

Contiene la carga de los eventos de síntesis de voz. Agregado en la versión 1.4.0

SpeechSynthesisResult

Contiene información detallada sobre el resultado de una operación de síntesis de voz. Agregado en la versión 1.4.0

SpeechSynthesisVisemeEventArgs

Contiene eventos de posición facial que corresponden a desplazamientos basados en el tiempo en voz sintetizada. Agregado en la versión 1.16.0

SpeechSynthesisWordBoundaryEventArgs

Contiene detalles de ubicación y longitud sobre las palabras en voz sintetizada. Agregado en la versión 1.7.0

SpeechSynthesizer

Realiza la síntesis de voz en altavoz, archivo u otras secuencias de salida de audio y obtiene audio sintetizado como resultado. Actualizado en la versión 1.16.0

SpeechTranslationConfig

Configuración de traducción de voz.

SpeechTranslationModel

Información del modelo de traducción de voz.

SyllableLevelTimingResult

Resultado de tiempo de nivel de syllable. Agregado en la versión 1.20.0

SynthesisVoicesResult

Contiene información detallada sobre la lista de voces de síntesis recuperadas. Agregado en la versión 1.16.0

VoiceInfo

Contiene información detallada sobre la voz de síntesis. Actualizado en la versión 1.17.0

WordLevelTimingResult

Para una palabra reconocida en el audio de voz, contiene el desplazamiento al inicio y la duración, en tics. 1 tic = 100 ns. Agregado en la versión 1.7.0

Enumeraciones

CancellationErrorCode

Enumera los códigos de error posibles cuando CancellationReason es Error. Agregado en la versión 1.1.0

CancellationReason

Enumera los posibles motivos por los que se podría cancelar un resultado de reconocimiento.

NoMatchReason

Enumera las posibles razones por las que no se reconoció un resultado de reconocimiento.

OutputFormat

Formato de salida.

ProfanityOption

Quita palabras soeces (jurando) o reemplaza letras de palabras soeces por estrellas. Agregado en la versión 1.5.0

PropertyId

Enumera los identificadores de propiedad de voz.

RecognitionFactorScope

Enumera el ámbito al que se aplica un factor de reconocimiento.

ResultReason

Describe un resultado de reconocimiento.

ServicePropertyChannel

Enumera los canales usados para pasar la configuración de propiedades al servicio. Agregado en la versión 1.5.0

SpeechSynthesisBoundaryType

Define el tipo de límite del evento de límite de síntesis de voz agregado en la versión 1.21.0.

SpeechSynthesisOutputFormat

Enumera los formatos de audio de salida de síntesis.

StreamStatus

Enumera los valores de estado posibles de una secuencia de datos de audio. Agregado en la versión 1.4.0

SynthesisVoiceGender

Enumera el género de voz de síntesis. Agregado en la versión 1.17.0

SynthesisVoiceType

Enumera los tipos de voz de síntesis.