Microsoft.CognitiveServices.Speech Espacio de nombres

Referencia

Importante

Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.

Clases

AudioDataStream	Proporciona datos de audio como una secuencia. Agregado en la versión 1.4.0
AutoDetectSourceLanguageConfig	Configura opciones para la detección automática de idiomas. Actualizado en la versión 1.13.0
AutoDetectSourceLanguageResult	Contiene idiomas detectados por el servicio voz. Agregado en la versión 1.9.0
CancellationDetails	Contiene información detallada sobre por qué se canceló un resultado.
ClassLanguageModel	Representa una lista de gramáticas para escenarios de gramática dinámica. Agregado en la versión 1.7.0
Connection	Clase de proxy para administrar la conexión al servicio de voz del reconocedor especificado. Agregado en la versión 1.2.0
ConnectionEventArgs	Contiene la carga de eventos conectados o desconectados agregados en la versión 1.2.0.
ConnectionMessage	Representa los mensajes específicos de la implementación enviados y recibidos del servicio de voz. Solo para depuración. Agregado en la versión 1.10.0
ConnectionMessageEventArgs	Contiene la carga de los eventos MessageReceived de una instancia de Connection. Agregado en la versión 1.10.0
DetailedSpeechRecognitionResult	Contiene detalles de reconocimiento, como puntuación de confianza, texto reconocido, forma léxica sin formato, formulario normalizado y formulario normalizado con palabras soeces enmascaradas. Se ha cambiado en la versión 1.7.0
EmbeddedSpeechConfig	Clase que define la configuración de voz insertada (sin conexión).
Grammar	Representa la gramática de clases base para personalizar el reconocimiento de voz. Agregado en la versión 1.5.0
GrammarList	Representa una lista de gramáticas para escenarios de gramática dinámica. Agregado en la versión 1.7.0
GrammarPhrase	Representa una frase que el usuario puede hablar. Agregado en la versión 1.5.0
HybridSpeechConfig	Clase que define configuraciones híbridas (en la nube y insertadas) para el reconocimiento de voz y la síntesis de voz.
KeywordRecognitionEventArgs	Clase para los eventos emitidos por .KeywordRecognizer
KeywordRecognitionModel	Representa el modelo de reconocimiento de palabras clave que puede desencadenar un evento cuando se hablan palabras clave predefinidas.
KeywordRecognitionResult	Contiene los resultados emitidos por .KeywordRecognizer
KeywordRecognizer	Reconoce una palabra o frase corta mediante un modelo de palabra clave.
NoMatchDetails	Contiene información detallada para los resultados de reconocimiento de NoMatch.
PhonemeLevelTimingResult	Resultado de tiempo del nivel de phoneme. Agregado en la versión 1.14.0
PhraseListGrammar	Identifica frases conocidas en datos de audio. Agregado en la versión 1.5.0
PronunciationAssessmentNBestPhoneme	Resultado fonético de la evaluación de pronunciación nbest Agregado en 1.20.0
PropertyCollection	Clase para recuperar o establecer un valor de propiedad de una colección de propiedades.
RecognitionEventArgs	Contiene la carga de eventos de reconocimiento, como Inicio y finalización de voz detectados.
RecognitionResult	Contiene información detallada sobre el resultado de una operación de reconocimiento.
Recognizer	Clase base que contiene principalmente controladores de eventos comunes.
SessionEventArgs	Contiene la carga de SessionStarted los eventos y SessionStopped .
SourceLanguageConfig	Configuración del idioma de origen. Agregado en la versión 1.17.0
SourceLanguageRecognizer	Detecta el idioma hablado en el audio de entrada. Agregado en la versión 1.17.0
SpeechConfig	Información sobre la suscripción, incluida la clave y la región, el punto de conexión, el host o el token de autorización.
SpeechRecognitionCanceledEventArgs	Contiene la carga de eventos de resultados cancelados del reconocimiento de voz.
SpeechRecognitionEventArgs	Contiene la carga de los eventos de reconocimiento y reconocimiento de voz.
SpeechRecognitionModel	Información del modelo de reconocimiento de voz.
SpeechRecognitionResult	Contiene el resultado del reconocimiento de voz.
SpeechRecognitionResultExtensions	Métodos de extensión para el resultado del reconocimiento de voz
SpeechRecognizer	Transcribe la voz en texto. La voz puede llegar a través del micrófono, el archivo de audio u otra secuencia de entrada de audio.
SpeechSynthesisBookmarkEventArgs	Contiene el evento bookmark en voz sintetizada. Agregado en la versión 1.16.0
SpeechSynthesisCancellationDetails	Contiene información detallada sobre por qué se canceló un resultado de síntesis de voz. Agregado en la versión 1.4.0
SpeechSynthesisEventArgs	Contiene la carga de los eventos de síntesis de voz. Agregado en la versión 1.4.0
SpeechSynthesisResult	Contiene información detallada sobre el resultado de una operación de síntesis de voz. Agregado en la versión 1.4.0
SpeechSynthesisVisemeEventArgs	Contiene eventos de posición facial que corresponden a desplazamientos basados en el tiempo en voz sintetizada. Agregado en la versión 1.16.0
SpeechSynthesisWordBoundaryEventArgs	Contiene detalles de ubicación y longitud sobre las palabras en voz sintetizada. Agregado en la versión 1.7.0
SpeechSynthesizer	Realiza la síntesis de voz en altavoz, archivo u otras secuencias de salida de audio y obtiene audio sintetizado como resultado. Actualizado en la versión 1.16.0
SpeechTranslationConfig	Configuración de traducción de voz.
SpeechTranslationModel	Información del modelo de traducción de voz.
SyllableLevelTimingResult	Resultado de tiempo de nivel de syllable. Agregado en la versión 1.20.0
SynthesisVoicesResult	Contiene información detallada sobre la lista de voces de síntesis recuperadas. Agregado en la versión 1.16.0
VoiceInfo	Contiene información detallada sobre la voz de síntesis. Actualizado en la versión 1.17.0
WordLevelTimingResult	Para una palabra reconocida en el audio de voz, contiene el desplazamiento al inicio y la duración, en tics. 1 tic = 100 ns. Agregado en la versión 1.7.0

Enumeraciones

CancellationErrorCode	Enumera los códigos de error posibles cuando CancellationReason es Error. Agregado en la versión 1.1.0
CancellationReason	Enumera los posibles motivos por los que se podría cancelar un resultado de reconocimiento.
NoMatchReason	Enumera las posibles razones por las que no se reconoció un resultado de reconocimiento.
OutputFormat	Formato de salida.
ProfanityOption	Quita palabras soeces (jurando) o reemplaza letras de palabras soeces por estrellas. Agregado en la versión 1.5.0
PropertyId	Enumera los identificadores de propiedad de voz.
RecognitionFactorScope	Enumera el ámbito al que se aplica un factor de reconocimiento.
ResultReason	Describe un resultado de reconocimiento.
ServicePropertyChannel	Enumera los canales usados para pasar la configuración de propiedades al servicio. Agregado en la versión 1.5.0
SpeechSynthesisBoundaryType	Define el tipo de límite del evento de límite de síntesis de voz agregado en la versión 1.21.0.
SpeechSynthesisOutputFormat	Enumera los formatos de audio de salida de síntesis.
StreamStatus	Enumera los valores de estado posibles de una secuencia de datos de audio. Agregado en la versión 1.4.0
SynthesisVoiceGender	Enumera el género de voz de síntesis. Agregado en la versión 1.17.0
SynthesisVoiceType	Enumera los tipos de voz de síntesis.

Compartir a través de

Microsoft.CognitiveServices.Speech Espacio de nombres

Clases

Enumeraciones

Recursos adicionales