Microsoft.CognitiveServices.Speech Espacio de nombres
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Clases
AudioDataStream |
Proporciona datos de audio como una secuencia. Agregado en la versión 1.4.0 |
AutoDetectSourceLanguageConfig |
Configura opciones para la detección automática de idiomas. Actualizado en la versión 1.13.0 |
AutoDetectSourceLanguageResult |
Contiene idiomas detectados por el servicio voz. Agregado en la versión 1.9.0 |
CancellationDetails |
Contiene información detallada sobre por qué se canceló un resultado. |
ClassLanguageModel |
Representa una lista de gramáticas para escenarios de gramática dinámica. Agregado en la versión 1.7.0 |
Connection |
Clase de proxy para administrar la conexión al servicio de voz del reconocedor especificado. Agregado en la versión 1.2.0 |
ConnectionEventArgs |
Contiene la carga de eventos conectados o desconectados agregados en la versión 1.2.0. |
ConnectionMessage |
Representa los mensajes específicos de la implementación enviados y recibidos del servicio de voz. Solo para depuración. Agregado en la versión 1.10.0 |
ConnectionMessageEventArgs |
Contiene la carga de los eventos MessageReceived de una instancia de Connection. Agregado en la versión 1.10.0 |
DetailedSpeechRecognitionResult |
Contiene detalles de reconocimiento, como puntuación de confianza, texto reconocido, forma léxica sin formato, formulario normalizado y formulario normalizado con palabras soeces enmascaradas. Se ha cambiado en la versión 1.7.0 |
EmbeddedSpeechConfig |
Clase que define la configuración de voz insertada (sin conexión). |
Grammar |
Representa la gramática de clases base para personalizar el reconocimiento de voz. Agregado en la versión 1.5.0 |
GrammarList |
Representa una lista de gramáticas para escenarios de gramática dinámica. Agregado en la versión 1.7.0 |
GrammarPhrase |
Representa una frase que el usuario puede hablar. Agregado en la versión 1.5.0 |
HybridSpeechConfig |
Clase que define configuraciones híbridas (en la nube y insertadas) para el reconocimiento de voz y la síntesis de voz. |
KeywordRecognitionEventArgs |
Clase para los eventos emitidos por .KeywordRecognizer |
KeywordRecognitionModel |
Representa el modelo de reconocimiento de palabras clave que puede desencadenar un evento cuando se hablan palabras clave predefinidas. |
KeywordRecognitionResult |
Contiene los resultados emitidos por .KeywordRecognizer |
KeywordRecognizer |
Reconoce una palabra o frase corta mediante un modelo de palabra clave. |
NoMatchDetails |
Contiene información detallada para los resultados de reconocimiento de NoMatch. |
PhonemeLevelTimingResult |
Resultado de tiempo del nivel de phoneme. Agregado en la versión 1.14.0 |
PhraseListGrammar |
Identifica frases conocidas en datos de audio. Agregado en la versión 1.5.0 |
PronunciationAssessmentNBestPhoneme |
Resultado fonético de la evaluación de pronunciación nbest Agregado en 1.20.0 |
PropertyCollection |
Clase para recuperar o establecer un valor de propiedad de una colección de propiedades. |
RecognitionEventArgs |
Contiene la carga de eventos de reconocimiento, como Inicio y finalización de voz detectados. |
RecognitionResult |
Contiene información detallada sobre el resultado de una operación de reconocimiento. |
Recognizer |
Clase base que contiene principalmente controladores de eventos comunes. |
SessionEventArgs |
Contiene la carga de SessionStarted los eventos y SessionStopped . |
SourceLanguageConfig |
Configuración del idioma de origen. Agregado en la versión 1.17.0 |
SourceLanguageRecognizer |
Detecta el idioma hablado en el audio de entrada. Agregado en la versión 1.17.0 |
SpeechConfig |
Información sobre la suscripción, incluida la clave y la región, el punto de conexión, el host o el token de autorización. |
SpeechRecognitionCanceledEventArgs |
Contiene la carga de eventos de resultados cancelados del reconocimiento de voz. |
SpeechRecognitionEventArgs |
Contiene la carga de los eventos de reconocimiento y reconocimiento de voz. |
SpeechRecognitionModel |
Información del modelo de reconocimiento de voz. |
SpeechRecognitionResult |
Contiene el resultado del reconocimiento de voz. |
SpeechRecognitionResultExtensions |
Métodos de extensión para el resultado del reconocimiento de voz |
SpeechRecognizer |
Transcribe la voz en texto. La voz puede llegar a través del micrófono, el archivo de audio u otra secuencia de entrada de audio. |
SpeechSynthesisBookmarkEventArgs |
Contiene el evento bookmark en voz sintetizada. Agregado en la versión 1.16.0 |
SpeechSynthesisCancellationDetails |
Contiene información detallada sobre por qué se canceló un resultado de síntesis de voz. Agregado en la versión 1.4.0 |
SpeechSynthesisEventArgs |
Contiene la carga de los eventos de síntesis de voz. Agregado en la versión 1.4.0 |
SpeechSynthesisResult |
Contiene información detallada sobre el resultado de una operación de síntesis de voz. Agregado en la versión 1.4.0 |
SpeechSynthesisVisemeEventArgs |
Contiene eventos de posición facial que corresponden a desplazamientos basados en el tiempo en voz sintetizada. Agregado en la versión 1.16.0 |
SpeechSynthesisWordBoundaryEventArgs |
Contiene detalles de ubicación y longitud sobre las palabras en voz sintetizada. Agregado en la versión 1.7.0 |
SpeechSynthesizer |
Realiza la síntesis de voz en altavoz, archivo u otras secuencias de salida de audio y obtiene audio sintetizado como resultado. Actualizado en la versión 1.16.0 |
SpeechTranslationConfig |
Configuración de traducción de voz. |
SpeechTranslationModel |
Información del modelo de traducción de voz. |
SyllableLevelTimingResult |
Resultado de tiempo de nivel de syllable. Agregado en la versión 1.20.0 |
SynthesisVoicesResult |
Contiene información detallada sobre la lista de voces de síntesis recuperadas. Agregado en la versión 1.16.0 |
VoiceInfo |
Contiene información detallada sobre la voz de síntesis. Actualizado en la versión 1.17.0 |
WordLevelTimingResult |
Para una palabra reconocida en el audio de voz, contiene el desplazamiento al inicio y la duración, en tics. 1 tic = 100 ns. Agregado en la versión 1.7.0 |
Enumeraciones
CancellationErrorCode |
Enumera los códigos de error posibles cuando CancellationReason es Error. Agregado en la versión 1.1.0 |
CancellationReason |
Enumera los posibles motivos por los que se podría cancelar un resultado de reconocimiento. |
NoMatchReason |
Enumera las posibles razones por las que no se reconoció un resultado de reconocimiento. |
OutputFormat |
Formato de salida. |
ProfanityOption |
Quita palabras soeces (jurando) o reemplaza letras de palabras soeces por estrellas. Agregado en la versión 1.5.0 |
PropertyId |
Enumera los identificadores de propiedad de voz. |
RecognitionFactorScope |
Enumera el ámbito al que se aplica un factor de reconocimiento. |
ResultReason |
Describe un resultado de reconocimiento. |
ServicePropertyChannel |
Enumera los canales usados para pasar la configuración de propiedades al servicio. Agregado en la versión 1.5.0 |
SpeechSynthesisBoundaryType |
Define el tipo de límite del evento de límite de síntesis de voz agregado en la versión 1.21.0. |
SpeechSynthesisOutputFormat |
Enumera los formatos de audio de salida de síntesis. |
StreamStatus |
Enumera los valores de estado posibles de una secuencia de datos de audio. Agregado en la versión 1.4.0 |
SynthesisVoiceGender |
Enumera el género de voz de síntesis. Agregado en la versión 1.17.0 |
SynthesisVoiceType |
Enumera los tipos de voz de síntesis. |
Azure SDK for .NET