speech Pacote

SDK de Fala da Microsoft para Python

Módulos

audio

Classes que se preocupam com o tratamento da entrada de áudio para os vários reconhecedores e a saída de áudio do sintetizador de fala.

dialog

Classes relacionadas ao conector do serviço de caixa de diálogo.

enums

SDK de Fala da Microsoft para Python

intent

Classes relacionadas ao reconhecimento de intenção da fala.

interop

SDK de Fala da Microsoft para Python

languageconfig

Classes que se preocupam com o tratamento de configurações de idioma

properties

SDK de Fala da Microsoft para Python

speech

Classes relacionadas ao reconhecimento de texto de fala, sintetização de fala de texto e classes gerais usadas nos vários reconhecedores.

transcription

Classes relacionadas à transcrição da conversa.

translation

Classes relacionadas à tradução de fala para outros idiomas.

version

SDK de Fala da Microsoft para Python

Classes

AudioDataStream

Representa o fluxo de dados de áudio usado para operar dados de áudio como um fluxo.

Gera um fluxo de dados de áudio de um resultado de síntese de fala (digite SpeechSynthesisResult) ou um resultado de reconhecimento de palavra-chave (digite KeywordRecognitionResult).

AutoDetectSourceLanguageResult

Representa o resultado da linguagem de origem de detecção automática.

O resultado pode ser inicializado a partir de um resultado de reconhecimento de fala.

CancellationDetails

SDK de Fala da Microsoft para Python

Connection

Classe proxy para gerenciar a conexão com o serviço de fala do especificado Recognizer.

Por padrão, um Recognizer gerencia de forma autônoma a conexão com o serviço quando necessário. A Connection classe fornece métodos adicionais para que os usuários abram ou fechem explicitamente uma conexão e assinem a conexão status alterações. O uso de Connection é opcional. Destina-se a cenários em que é necessário ajustar o comportamento do aplicativo com base em status de conexão. Opcionalmente, os usuários podem chamar open para iniciar manualmente uma conexão de serviço antes de iniciar o reconhecimento no associado a Recognizer este Connection. Depois de iniciar um reconhecimento, chamar open ou close pode falhar. Isso não afetará o Reconhecedor nem o reconhecimento contínuo. A conexão pode cair por vários motivos, o Reconhecedor sempre tentará reinstituir a conexão conforme necessário para garantir operações em andamento. Em todos esses casos, connected/disconnected os eventos indicarão a alteração do status de conexão.

Observação

Atualizado na versão 1.17.0.

Construtor para uso interno.

ConnectionEventArgs

Fornece dados para o ConnectionEvent.

Observação

Adicionado na versão 1.2.0

Construtor para uso interno.

EventSignal

Os clientes podem se conectar ao sinal de evento para receber eventos ou desconectar-se do sinal de evento para interromper o recebimento de eventos.

Construtor para uso interno.

KeywordRecognitionEventArgs

Classe para argumentos de evento de reconhecimento de palavra-chave.

Construtor para uso interno.

KeywordRecognitionModel

Representa um modelo de reconhecimento de palavra-chave.

KeywordRecognitionResult

Resultado de uma operação de reconhecimento de palavra-chave.

Construtor para uso interno.

KeywordRecognizer

Um reconhecedor de palavra-chave.

NoMatchDetails

SDK de Fala da Microsoft para Python

PhraseListGrammar

Classe que permite a adição em runtime de dicas de frase para ajudar no reconhecimento de fala.

As frases adicionadas ao reconhecedor são efetivas no início do próximo reconhecimento ou, na próxima vez, o reconhecedor de fala deve se reconectar ao serviço de fala.

Observação

Adicionado na versão 1.5.0.

Construtor para uso interno.

PronunciationAssessmentConfig

Representa a configuração de avaliação de pronúncia

Observação

Adicionado na versão 1.14.0.

A configuração pode ser inicializada de duas maneiras:

  • dos parâmetros: passe o texto de referência, o sistema de classificação, a granularidade, habilite o erro e a ID do cenário.

  • de json: passar uma cadeia de caracteres json

Para obter os detalhes dos parâmetros, consulte https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters

PronunciationAssessmentPhonemeResult

Contém o resultado da avaliação de pronúncia no nível do phoneme

Observação

Adicionado na versão 1.14.0.

PronunciationAssessmentResult

Representa o resultado da avaliação de pronúncia.

Observação

Adicionado na versão 1.14.0.

O resultado pode ser inicializado a partir de um resultado de reconhecimento de fala.

PronunciationAssessmentWordResult

Contém o resultado da avaliação de pronúncia no nível da palavra

Observação

Adicionado na versão 1.14.0.

PropertyCollection

Classe para recuperar ou definir um valor de propriedade de uma coleção de propriedades.

RecognitionEventArgs

Fornece dados para o RecognitionEvent.

Construtor para uso interno.

RecognitionResult

Informações detalhadas sobre o resultado de uma operação de reconhecimento.

Construtor para uso interno.

Recognizer

Classe base para diferentes reconhecedores

ResultFuture

O resultado de uma operação assíncrona.

construtor privado

SessionEventArgs

Classe base para argumentos de evento de sessão.

Construtor para uso interno.

SourceLanguageRecognizer

Um reconhecedor de idioma de origem – reconhecedor de idioma autônomo, pode ser usado para detecção de idioma único ou idioma contínuo.

Observação

Adicionado na versão 1.18.0.

SpeechConfig

Classe que define configurações para reconhecimento de fala/intenção e síntese de fala.

A configuração pode ser inicializada de diferentes maneiras:

  • da assinatura: passar uma chave de assinatura e uma região

  • do ponto de extremidade: passe um ponto de extremidade. A chave de assinatura ou o token de autorização são opcionais.

  • do host: passe um endereço de host. A chave de assinatura ou o token de autorização são opcionais.

  • do token de autorização: passe um token de autorização e uma região

SpeechRecognitionCanceledEventArgs

Classe para argumentos de evento cancelados de reconhecimento de fala.

Construtor para uso interno.

SpeechRecognitionEventArgs

Classe para argumentos de evento de reconhecimento de fala.

Construtor para uso interno.

SpeechRecognitionResult

Classe base para resultados de reconhecimento de fala.

Construtor para uso interno.

SpeechRecognizer

Um reconhecedor de fala. Se você precisar especificar informações de idioma de origem, especifique apenas um desses três parâmetros, idioma, source_language_config ou auto_detect_source_language_config.

SpeechSynthesisBookmarkEventArgs

Classe para argumentos de evento de indicador de síntese de fala.

Observação

Adicionado na versão 1.16.0.

Construtor para uso interno.

SpeechSynthesisCancellationDetails

Contém informações detalhadas sobre por que um resultado foi cancelado.

SpeechSynthesisEventArgs

Classe para argumentos de evento de síntese de fala.

Construtor para uso interno.

SpeechSynthesisResult

Resultado de uma operação de síntese de fala.

Construtor para uso interno.

SpeechSynthesisVisemeEventArgs

Classe para argumentos de evento viseme de síntese de fala.

Observação

Adicionado na versão 1.16.0.

Construtor para uso interno.

SpeechSynthesisWordBoundaryEventArgs

Classe para argumentos de evento de limite de palavra de síntese de fala.

Observação

Atualizado na versão 1.21.0.

Construtor para uso interno.

SpeechSynthesizer

Um sintetizador de fala.

SyllableLevelTimingResult

Contém o resultado do tempo de nível de sílaba

Observação

Adicionado na versão 1.20.0.

SynthesisVoicesResult

Contém informações detalhadas sobre a lista de vozes de síntese recuperada.

Observação

Adicionado na versão 1.16.0.

Construtor para uso interno.

VoiceInfo

Contém informações detalhadas sobre as informações de voz de síntese.

Observação

Atualizado na versão 1.17.0.

Construtor para uso interno.

Enumerações

AudioStreamContainerFormat

Define o formato de contêiner de fluxo de áudio com suporte.

AudioStreamWaveFormat

Representa o formato especificado dentro do contêiner WAV.

CancellationErrorCode

Define o código de erro caso CancellationReason seja Error.

CancellationReason

Define os possíveis motivos pelos quais um resultado de reconhecimento pode ser cancelado.

NoMatchReason

Define os possíveis motivos pelos quais um resultado de reconhecimento pode não ser reconhecido.

OutputFormat

Formato de saída.

ProfanityOption

Remove palavrões (palavrões) ou substitui letras de palavras profanas por estrelas.

PronunciationAssessmentGradingSystem

Define o sistema de pontos para calibragem de pontuação de pronúncia; o valor padrão é FivePoint.

PronunciationAssessmentGranularity

Define a granularidade da avaliação de pronúncia; o valor padrão é Phoneme.

PropertyId

Define ids de propriedade de fala.

ResultReason

Especifica os possíveis motivos pelos quais um resultado de reconhecimento pode ser gerado.

ServicePropertyChannel

Define canais usados para passar as configurações de propriedade para o serviço.

SpeechSynthesisOutputFormat

Define os possíveis formatos de áudio de saída de síntese de fala.

StreamStatus

Define a possível status do fluxo de dados de áudio.

SynthesisVoiceGender

Define o gênero das vozes de síntese

SynthesisVoiceType

Define o tipo de vozes de síntese