Compartir a través de


SpeechConfig Clase

  • java.lang.Object
    • com.microsoft.cognitiveservices.speech.SpeechConfig

Implementaciones

java.lang.AutoCloseable

public class SpeechConfig
implements java.lang.AutoCloseable

Configuración de voz. Nota: se debe llamar a close() para liberar los recursos subyacentes mantenidos por el objeto. Se ha cambiado en la versión 1.7.0

Resumen del campo

Modificador y tipo Campo y descripción
static java.lang.Class<?> speechConfigClass

Descriptor de acceso para cargar la biblioteca nativa.

Resumen del constructor

Modificador Constructor Description
protected SpeechConfig(long handleValue)

Constructor interno para el objeto de configuración de voz.

Resumen del método

Modificador y tipo Método y descripción
void close()

Elimine los recursos asociados.

void enableAudioLogging()

Habilite el registro de audio en el servicio.

void enableDictation()

Habilite el dictado.

static SpeechConfig fromAuthorizationToken(String authorizationToken, String region)

Crea una instancia de una configuración de voz con el token de autorización y la región de servicio especificadas.

static SpeechConfig fromEndpoint(URI endpoint)

Crea una instancia de la configuración de voz con el punto de conexión especificado.

static SpeechConfig fromEndpoint(URI endpoint, String subscriptionKey)

Crea una instancia de la configuración de voz con el punto de conexión y la clave de suscripción especificados.

static SpeechConfig fromHost(URI host)

Crea una instancia de la configuración de voz con el host especificado.

static SpeechConfig fromHost(URI host, String subscriptionKey)

Crea una instancia de la configuración de voz con el host y la clave de suscripción especificados.

static SpeechConfig fromSubscription(String subscriptionKey, String region)

Crea una instancia de una configuración de voz con la clave de suscripción y la región de servicio especificadas.

java.lang.String getAuthorizationToken()

Obtiene el token de autorización.

java.lang.String getEndpointId()

Obtiene el identificador de punto de conexión de un modelo de voz personalizado que se usa para el reconocimiento de voz o un modelo de voz personalizado para la síntesis de voz.

SafeHandle getImpl()

Obtenga el identificador nativo para el objeto de configuración de voz.

OutputFormat getOutputFormat()

Obtiene el formato de salida del reconocimiento de voz (simple o detallado).

java.lang.String getProperty(PropertyId id)

Obtiene la propiedad por id. de propiedad.

java.lang.String getProperty(String name)

Obtiene una propiedad con nombre como valor.

java.lang.String getSpeechRecognitionLanguage()

Obtiene el idioma de reconocimiento de voz.

java.lang.String getSpeechSynthesisLanguage()

Obtiene el lenguaje de síntesis de voz.

java.lang.String getSpeechSynthesisOutputFormat()

Obtiene el formato de salida de síntesis de voz.

java.lang.String getSpeechSynthesisVoiceName()

Obtiene el nombre de voz de síntesis de voz.

void requestWordLevelTimestamps()

Incluye marcas de tiempo de nivel de palabra.

void setAuthorizationToken(String value)

Establece el token de autorización.

void setEndpointId(String value)

Establece el identificador de punto de conexión de un modelo de voz personalizado que se usa para el reconocimiento de voz o un modelo de voz personalizado para la síntesis de voz.

void setOutputFormat(OutputFormat format)

Establece el formato de salida del reconocimiento de voz (simple o detallado).

void setProfanity(ProfanityOption profanity)

Establece la opción soece.

void setProperty(PropertyId id, String value)

Establece la propiedad por identificador de propiedad.

void setProperty(String name, String value)

Establece una propiedad con nombre como valor.

void setProxy(String proxyHostName, int proxyPort, String proxyUserName, String proxyPassword)

Establece la configuración de proxy agregada en la versión 1.1.0.

void setServiceProperty(String name, String value, ServicePropertyChannel channel)

Establece un valor de propiedad que se pasará al servicio mediante el canal especificado.

void setSpeechRecognitionLanguage(String value)

Establece el idioma de reconocimiento de voz

void setSpeechSynthesisLanguage(String value)

Establece el lenguaje de síntesis de voz.

void setSpeechSynthesisOutputFormat(SpeechSynthesisOutputFormat value)

Establece el formato de salida de síntesis de voz.

void setSpeechSynthesisVoiceName(String value)

Establece el nombre de voz de síntesis de voz.

Métodos heredados de java.lang.Object

java.lang.Object.clone java.lang.Object.equals java.lang.Object.finalize java.lang.Object.getClass java.lang.Object.hashCode java.lang.Object.notify java.lang.Object.notifyAll java.lang.Object.toString java.lang.Object.wait java.lang.Object.wait java.lang.Object.wait

Detalles del campo

speechConfigClass

public static Class speechConfigClass

Descriptor de acceso para cargar la biblioteca nativa. Contiene la clase activa para que la clase GC no la recupere (y las variables locales).

Detalles del constructor

SpeechConfig

protected SpeechConfig(long handleValue)

Constructor interno para el objeto de configuración de voz.

Parameters:

handleValue - Identificador nativo.

Detalles del método

close

public void close()

Elimine los recursos asociados.

enableAudioLogging

public void enableAudioLogging()

Habilite el registro de audio en el servicio. Los registros de audio y contenido se almacenan en el almacenamiento propiedad de Microsoft o en su propia cuenta de almacenamiento vinculada a su suscripción de Cognitive Services (Bring Your Own Storage (BYOS) habilitado para el recurso de voz. Se agregó en la versión 1.5.0.

enableDictation

public void enableDictation()

Habilite el dictado. Solo se admite en el reconocimiento continuo de voz. Se agregó en la versión 1.5.0.

fromAuthorizationToken

public static SpeechConfig fromAuthorizationToken(String authorizationToken, String region)

Crea una instancia de una configuración de voz con el token de autorización y la región de servicio especificadas. Nota: El autor de la llamada debe asegurarse de que el token de autorización es válido. Antes de que expire el token de autorización, el autor de la llamada debe actualizarlo llamando a este establecedor con un nuevo token válido. A medida que se copian los valores de configuración al crear un nuevo reconocedor, el nuevo valor de token no se aplicará a los reconocedores que ya se hayan creado. Para los reconocedores que se han creado antes, debe establecer el token de autorización del reconocedor correspondiente para actualizar el token. De lo contrario, los reconocedores encontrarán errores durante el reconocimiento.

Parameters:

authorizationToken - Token de autorización.
region - Nombre de la región (consulte la página región).

Returns:

Una instancia de configuración de voz.

fromEndpoint

public static SpeechConfig fromEndpoint(URI endpoint)

Crea una instancia de la configuración de voz con el punto de conexión especificado. Este método está pensado solo para los usuarios que usan un punto de conexión de servicio o parámetros no estándar. Nota: Los parámetros de consulta especificados en el URI del punto de conexión no se cambian, incluso si se establecen mediante otras API. Por ejemplo, si el idioma de reconocimiento se define en URI como parámetro de consulta "language=de-DE", y también se establece mediante setSpeechRecognitionLanguage("en-US"), la configuración de idioma en URI tiene prioridad y el idioma efectivo es "de-DE". Otras API solo pueden establecer los parámetros que no se especifiquen en el URI del punto de conexión. Nota: si el punto de conexión requiere una clave de suscripción para la autenticación, use fromEndpoint(java.net.URI, String) para pasar la clave de suscripción como parámetro. Para usar un token de autorización con fromEndpoint, use este método para crear una instancia de SpeechConfig y, a continuación, llame a setAuthorizationToken() en la instancia de SpeechConfig creada. Nota: Se ha agregado en la versión 1.5.0.

Parameters:

endpoint - Punto de conexión de servicio al que se va a conectar.

Returns:

Una instancia de configuración de voz.

fromEndpoint

public static SpeechConfig fromEndpoint(URI endpoint, String subscriptionKey)

Crea una instancia de la configuración de voz con el punto de conexión y la clave de suscripción especificados. Este método está pensado solo para los usuarios que usan un punto de conexión de servicio o parámetros no estándar. Nota: Los parámetros de consulta especificados en el URI del punto de conexión no se cambian, incluso si se establecen mediante otras API. Por ejemplo, si el idioma de reconocimiento se define en URI como parámetro de consulta "language=de-DE", y también se establece mediante setSpeechRecognitionLanguage("en-US"), la configuración de idioma en URI tiene prioridad y el idioma efectivo es "de-DE". Otras API solo pueden establecer los parámetros que no se especifiquen en el URI del punto de conexión. Nota: Para usar un token de autorización con fromEndpoint, use fromEndpoint(java.net.URI) y, a continuación, llame a setAuthorizationToken() en la instancia de SpeechConfig creada.

Parameters:

endpoint - Punto de conexión de servicio al que se va a conectar.
subscriptionKey - Clave de suscripción.

Returns:

Una instancia de configuración de voz.

fromHost

public static SpeechConfig fromHost(URI host)

Crea una instancia de la configuración de voz con el host especificado. Este método está pensado solo para los usuarios que usan un host de servicio no predeterminado. Se presupone la ruta de acceso del recurso estándar. En el caso de los servicios con una ruta de acceso de recursos no estándar o ninguna ruta de acceso, use fromEndpoint en su lugar. Nota: Los parámetros de consulta no se permiten en el URI del host y deben establecerse mediante otras API. Nota: Si el host requiere una clave de suscripción para la autenticación, use fromHost(java.net.URI, String) para pasar la clave de suscripción como parámetro. Para usar un token de autorización con fromHost, use este método para crear una instancia de SpeechConfig y, a continuación, llame a setAuthorizationToken() en la instancia de SpeechConfig creada. Nota: Se ha agregado en la versión 1.8.0.

Parameters:

host - Host de servicio al que se va a conectar. El formato es "protocol://host:port", donde ":p ort" es opcional.

Returns:

Una instancia de configuración de voz.

fromHost

public static SpeechConfig fromHost(URI host, String subscriptionKey)

Crea una instancia de la configuración de voz con el host y la clave de suscripción especificados. Este método está pensado solo para los usuarios que usan un host de servicio no predeterminado. Se presupone la ruta de acceso del recurso estándar. En el caso de los servicios con una ruta de acceso de recursos no estándar o ninguna ruta de acceso, use fromEndpoint en su lugar. Nota: Los parámetros de consulta no se permiten en el URI del host y deben establecerse mediante otras API. Nota: Para usar un token de autorización con fromHost, use fromHost(java.net.URI) y, a continuación, llame a setAuthorizationToken() en la instancia de SpeechConfig creada. Nota: Se ha agregado en la versión 1.8.0.

Parameters:

host - Host de servicio al que se va a conectar. El formato es "protocol://host:port", donde ":p ort" es opcional.
subscriptionKey - Clave de suscripción.

Returns:

Una instancia de configuración de voz.

fromSubscription

public static SpeechConfig fromSubscription(String subscriptionKey, String region)

Crea una instancia de una configuración de voz con la clave de suscripción y la región de servicio especificadas.

Parameters:

subscriptionKey - Clave de suscripción.
region - El nombre de la región (consulte la página región).

Returns:

Una instancia de configuración de voz.

getAuthorizationToken

public String getAuthorizationToken()

Obtiene el token de autorización.

Returns:

Token de autorización.

getEndpointId

public String getEndpointId()

Obtiene el identificador de punto de conexión de un modelo de voz personalizado que se usa para el reconocimiento de voz o un modelo de voz personalizado para la síntesis de voz.

Returns:

El id. del punto de conexión.

getImpl

public SafeHandle getImpl()

Obtenga el identificador nativo para el objeto de configuración de voz.

Returns:

Identificador nativo.

getOutputFormat

public OutputFormat getOutputFormat()

Obtiene el formato de salida del reconocimiento de voz (simple o detallado). Nota: Este formato de salida es para los resultados del reconocimiento de voz, se usa com.microsoft.cognitiveservices.speech.SpeechConfig#setSpeechSynthesisOutputFormat para establecer el formato de salida de audio sintetizado.

Returns:

Devuelve el formato de salida del reconocimiento de voz.

getProperty

public String getProperty(PropertyId id)

Obtiene la propiedad por propertyId. Se agregó en la versión 1.3.0.

Parameters:

id - PropertyId de la propiedad.

Returns:

Valor.

getProperty

public String getProperty(String name)

Obtiene una propiedad con nombre como valor.

Parameters:

name - el nombre de la propiedad.

Returns:

Valor.

getSpeechRecognitionLanguage

public String getSpeechRecognitionLanguage()

Obtiene el idioma de reconocimiento de voz.

Returns:

Devuelve el idioma de reconocimiento.

getSpeechSynthesisLanguage

public String getSpeechSynthesisLanguage()

Obtiene el lenguaje de síntesis de voz. Agregado en la versión 1.7.0

Returns:

Devuelve el lenguaje de síntesis.

getSpeechSynthesisOutputFormat

public String getSpeechSynthesisOutputFormat()

Obtiene el formato de salida de síntesis de voz. Agregado en la versión 1.7.0

Returns:

Devuelve el formato de salida de síntesis.

getSpeechSynthesisVoiceName

public String getSpeechSynthesisVoiceName()

Obtiene el nombre de voz de síntesis de voz. Agregado en la versión 1.7.0

Returns:

Devuelve el nombre de voz de síntesis.

requestWordLevelTimestamps

public void requestWordLevelTimestamps()

Incluye marcas de tiempo de nivel de palabra. Se agregó en la versión 1.5.0.

setAuthorizationToken

public void setAuthorizationToken(String value)

Establece el token de autorización. Nota: El autor de la llamada debe asegurarse de que el token de autorización es válido. Antes de que expire el token de autorización, el autor de la llamada debe actualizarlo llamando a este establecedor con un nuevo token válido. Como los valores de configuración se copian al crear un nuevo reconocedor, el nuevo valor de token no se aplicará a los reconocedores que ya se han creado. Para los reconocedores que se han creado antes, debe establecer el token de autorización del reconocedor correspondiente para actualizar el token. De lo contrario, los reconocedores encontrarán errores durante el reconocimiento.

Parameters:

value - token de autorización.

setEndpointId

public void setEndpointId(String value)

Establece el identificador de punto de conexión de un modelo de voz personalizado que se usa para el reconocimiento de voz o un modelo de voz personalizado para la síntesis de voz.

Parameters:

value - el identificador del punto de conexión.

setOutputFormat

public void setOutputFormat(OutputFormat format)

Establece el formato de salida del reconocimiento de voz (simple o detallado). Nota: Este formato de salida es para los resultados del reconocimiento de voz, use com.microsoft.cognitiveservices.speech.SpeechConfig#setSpeechSynthesisOutputFormat para establecer el formato de salida de audio sintetizado.

Parameters:

format - Formato de salida del reconocimiento de voz.

setProfanity

public void setProfanity(ProfanityOption profanity)

Establece la opción soece. Se agregó en la versión 1.5.0.

Parameters:

profanity - la opción de propiedad que se va a establecer.

setProperty

public void setProperty(PropertyId id, String value)

Establece la propiedad por propertyId. Se agregó en la versión 1.3.0.

Parameters:

id - PropertyId de la propiedad.
value - Valor.

setProperty

public void setProperty(String name, String value)

Establece una propiedad con nombre como valor.

Parameters:

name - el nombre de la propiedad.
value - el valor.

setProxy

public void setProxy(String proxyHostName, int proxyPort, String proxyUserName, String proxyPassword)

Establece la configuración de proxy agregada en la versión 1.1.0. Nota: La funcionalidad de proxy no está disponible en macOS. Esta función no tendrá ningún efecto en esta plataforma.

Parameters:

proxyHostName - el nombre de host del servidor proxy, sin el esquema de protocolo (http://)
proxyPort - número de puerto del servidor proxy.
proxyUserName - el nombre de usuario del servidor proxy. Use una cadena vacía si no se necesita ningún nombre de usuario.
proxyPassword - la contraseña del servidor proxy. Use una cadena vacía si no se necesita ninguna contraseña de usuario.

setServiceProperty

public void setServiceProperty(String name, String value, ServicePropertyChannel channel)

Establece un valor de propiedad que se pasará al servicio mediante el canal especificado. Se agregó en la versión 1.5.0.

Parameters:

name - el nombre de la propiedad.
value - el valor de la propiedad.
channel - el canal usado para pasar la propiedad especificada al servicio.

setSpeechRecognitionLanguage

public void setSpeechRecognitionLanguage(String value)

Establece el idioma de reconocimiento de voz

Parameters:

value - el identificador de idioma en formato BCP-47.

setSpeechSynthesisLanguage

public void setSpeechSynthesisLanguage(String value)

Establece el lenguaje de síntesis de voz. Se agregó en la versión 1.7.0

Parameters:

value - el identificador de idioma en formato BCP-47 (por ejemplo, en-US).

setSpeechSynthesisOutputFormat

public void setSpeechSynthesisOutputFormat(SpeechSynthesisOutputFormat value)

Establece el formato de salida de síntesis de voz. Se agregó en la versión 1.7.0

Parameters:

value - Identificador del formato de salida de síntesis (por ejemplo, Riff16Khz16BitMonoPcm).

setSpeechSynthesisVoiceName

public void setSpeechSynthesisVoiceName(String value)

Establece el nombre de voz de síntesis de voz. Se agregó en la versión 1.7.0

Parameters:

value - Nombre de voz de síntesis de voz.

Se aplica a