SpeechConfig Classe

Classe che definisce le configurazioni per il riconoscimento vocale/finalità e la sintesi vocale.

La configurazione può essere inizializzata in modi diversi:

  • dalla sottoscrizione: passare una chiave di sottoscrizione e un'area

  • dall'endpoint: passare un endpoint. La chiave di sottoscrizione o il token di autorizzazione sono facoltativi.

  • dall'host: passare un indirizzo host. La chiave di sottoscrizione o il token di autorizzazione sono facoltativi.

  • dal token di autorizzazione: passare un token di autorizzazione e un'area

Ereditarietà
builtins.object
SpeechConfig

Costruttore

SpeechConfig(subscription: str | None = None, region: str | None = None, endpoint: str | None = None, host: str | None = None, auth_token: str | None = None, speech_recognition_language: str | None = None)

Parametri

Nome Descrizione
subscription

Chiave di sottoscrizione.

valore predefinito: None
region

Nome area (vedere la pagina area).

valore predefinito: None
endpoint

Endpoint del servizio a cui connettersi.

valore predefinito: None
host

Host del servizio a cui connettersi. Verrà assunto il percorso delle risorse standard. Il formato è "protocol://host:port" dove ":p ort" è facoltativo.

valore predefinito: None
auth_token

Token di autorizzazione.

valore predefinito: None
speech_recognition_language

Lingua di input per il riconoscimento vocale. La lingua è specificata in formato BCP-47.

valore predefinito: None

Metodi

enable_audio_logging

Abilita la registrazione audio nel servizio. I log di audio e contenuto vengono archiviati nell'archiviazione di proprietà Microsoft o nell'account di archiviazione collegato alla sottoscrizione di Servizi cognitivi (Bring Your Own Storage (BYOS) abilitata per la risorsa Voce.

Nota

Aggiunta nella versione 1.5.0.

enable_dictation

Abilita la dettatura. Supportato solo nel riconoscimento vocale continuo.

Nota

Aggiunta nella versione 1.5.0.

get_property

Ottenere una proprietà in base all'ID.

get_property_by_name

Ottenere una proprietà in base al nome.

request_word_level_timestamps

Include timestamp a livello di parola nel risultato della risposta.

Nota

Aggiunta nella versione 1.5.0.

set_profanity

Impostare l'opzione volgarità.

Nota

Aggiunta nella versione 1.5.0.

set_properties

Impostare più proprietà in base all'ID.

set_properties_by_name

Impostare più proprietà in base al nome.

set_property

Impostare una proprietà in base all'ID.

set_property_by_name

Impostare una proprietà in base al nome.

set_proxy

Impostare le informazioni del proxy.

Nota

La funzionalità proxy non è disponibile in macOS. Questa funzione non avrà alcun effetto su

questa piattaforma.

set_service_property

Imposta un valore di proprietà che verrà passato al servizio usando il canale specificato.

Nota

Aggiunta nella versione 1.5.0.

set_speech_synthesis_output_format

Impostare il formato audio di output della sintesi vocale.

enable_audio_logging

Abilita la registrazione audio nel servizio. I log di audio e contenuto vengono archiviati nell'archiviazione di proprietà Microsoft o nell'account di archiviazione collegato alla sottoscrizione di Servizi cognitivi (Bring Your Own Storage (BYOS) abilitata per la risorsa Voce.

Nota

Aggiunta nella versione 1.5.0.

enable_audio_logging()

enable_dictation

Abilita la dettatura. Supportato solo nel riconoscimento vocale continuo.

Nota

Aggiunta nella versione 1.5.0.

enable_dictation()

get_property

Ottenere una proprietà in base all'ID.

get_property(property_id: PropertyId) -> str

Parametri

Nome Descrizione
property_id
Necessario

ID della proprietà da recuperare.

Restituisce

Tipo Descrizione

Valore della proprietà.

get_property_by_name

Ottenere una proprietà in base al nome.

get_property_by_name(property_name: str) -> str

Parametri

Nome Descrizione
property_name
Necessario

Nome della proprietà da recuperare.

Restituisce

Tipo Descrizione

Valore della proprietà.

request_word_level_timestamps

Include timestamp a livello di parola nel risultato della risposta.

Nota

Aggiunta nella versione 1.5.0.

request_word_level_timestamps()

set_profanity

Impostare l'opzione volgarità.

Nota

Aggiunta nella versione 1.5.0.

set_profanity(profanity_option: ProfanityOption) -> None

Parametri

Nome Descrizione
profanity_option
Necessario

Livello volgare da impostare.

set_properties

Impostare più proprietà in base all'ID.

set_properties(properties: Dict[PropertyId, str])

Parametri

Nome Descrizione
properties
Necessario

Id proprietà di mapping dict ai valori da impostare.

set_properties_by_name

Impostare più proprietà in base al nome.

set_properties_by_name(properties: Dict[str, str])

Parametri

Nome Descrizione
properties
Necessario

Id proprietà di mapping dict ai valori da impostare.

set_property

Impostare una proprietà in base all'ID.

set_property(property_id: PropertyId, value: str)

Parametri

Nome Descrizione
property_id
Necessario

ID della proprietà da impostare.

value
Necessario

Valore da impostare per la proprietà.

set_property_by_name

Impostare una proprietà in base al nome.

set_property_by_name(property_name: str, value: str)

Parametri

Nome Descrizione
property_name
Necessario

Nome della proprietà da impostare.

value
Necessario

Valore da impostare per la proprietà.

set_proxy

Impostare le informazioni del proxy.

Nota

La funzionalità proxy non è disponibile in macOS. Questa funzione non avrà alcun effetto su

questa piattaforma.

set_proxy(hostname: str, port: int, username: str = None, password: str = None)

Parametri

Nome Descrizione
hostname
Necessario

Nome host del server proxy. Non aggiungere informazioni sul protocollo (http) al nome host.

port
Necessario

Numero di porta del server proxy.

username

Nome utente del server proxy.

valore predefinito: None
password

Password del server proxy.

valore predefinito: None

set_service_property

Imposta un valore di proprietà che verrà passato al servizio usando il canale specificato.

Nota

Aggiunta nella versione 1.5.0.

set_service_property(name: str, value: str, channel: ServicePropertyChannel)

Parametri

Nome Descrizione
name
Necessario

Nome della proprietà.

value
Necessario

Valore della proprietà.

channel
Necessario

Canale usato per passare la proprietà specificata al servizio.

set_speech_synthesis_output_format

Impostare il formato audio di output della sintesi vocale.

set_speech_synthesis_output_format(format_id: SpeechSynthesisOutputFormat)

Parametri

Nome Descrizione
format_id
Necessario

Id formato audio, ad esempio Riff16Khz16BitMonoPcm.

Attributi

authorization_token

Token di autorizzazione che verrà usato per la connessione al servizio.

Nota

Il chiamante deve assicurarsi che il token di autorizzazione sia valido. Prima dell'oggetto

il token di autorizzazione scade, il chiamante deve aggiornarlo chiamando questo setter con un

nuovo token valido. Man mano che i valori di configurazione vengono copiati durante la creazione di un nuovo riconoscimento,

il nuovo valore del token non verrà applicato ai riconoscitori già creati. For

riconoscimento che sono stati creati prima, è necessario impostare il token di autorizzazione del

riconoscimento corrispondente per aggiornare il token. In caso contrario, i riconoscitori incontreranno

errori durante il riconoscimento.

endpoint_id

ID endpoint.

output_format

Formato di output (semplice o dettagliato) del risultato del riconoscimento vocale.

region

Chiave di area usata per creare il riconoscimento.

speech_recognition_language

Nome della lingua parlata da riconoscere in formato BCP-47.

speech_synthesis_language

Ottenere il linguaggio di sintesi vocale.

speech_synthesis_output_format_string

Ottenere la stringa di formato audio di sintesi vocale.

speech_synthesis_voice_name

Ottenere il nome della voce di sintesi vocale.

subscription_key

Chiave di sottoscrizione usata per creare Il riconoscimento.