Tipos de serviços de API de fala
Você pode usar o serviço de Fala dos Serviços Cognitivos do Azure para executar transformações de idioma falado, incluindo conversão de fala em texto, conversão de texto em fala, tradução de fala e reconhecimento do locutor.
Observação
Use o Serviço Cognitivo do Azure para Idioma se quiser coletar insights sobre termos ou frases ou obter uma análise contextual detalhada da linguagem falada ou escrita.
Serviços
- A conversão de fala em texto pode converter fluxos de áudio em texto em tempo real ou em lote.
- A conversão de texto em fala permite que os aplicativos convertam texto em fala semelhante à humana.
- A tradução de fala fornece tradução de fala em fala em vários idiomas e de fala em texto de fluxos de áudio.
Como escolher um serviço
Este fluxograma pode ajudar você a escolher o serviço de fala que atenda às suas necessidades:
O lado esquerdo do diagrama ilustra processos de áudio para áudio ou áudio para texto.
- A conversão de fala em texto é usada para converter fala de uma fonte de áudio em um formato de texto.
- A conversão de fala em fala é usada para traduzir fala em um idioma para fala em outro idioma.
O lado direito do diagrama ilustra processos de conversão de texto em áudio.
- A conversão de texto em fala é usada para gerar áudio falado com base em uma fonte de texto.
Casos de uso comuns
A tabela a seguir recomenda serviços para alguns casos de uso comuns.
Caso de uso | Serviço usado |
---|---|
Fornecer legendas ocultas para vídeos gravados ou ao vivo | Conversão de fala em texto |
Criar uma transcrição de uma chamada telefônica ou de uma reunião | Conversão de fala em texto |
Implementar ditado de notas automatizado | Conversão de fala em texto |
Determinar a entrada do usuário pretendida para obter um processamento adicional | Conversão de fala em texto |
Gerar respostas faladas para a entrada do usuário | Conversão de texto em fala |
Criar menus de vozes para sistemas telefônicos | Conversão de texto em fala |
Ler mensagens de email ou de texto em voz alta em cenários de mãos livres | Conversão de texto em fala |
Transmitir anúncios em locais públicos, como estações ferroviárias ou aeroportos | Conversão de texto em fala |
Gerar legendas ocultas em tempo real de uma fala ou tradução bidirecional simultânea de uma conversa falada. | Conversão de fala em texto |
Colaboradores
Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.
Principais autores:
- Kruti Mehta | Engenheira sênior de Fast-Track do Azure
- Oscar Shimabukuro | Arquiteto sênior de soluções de nuvem
Outros colaboradores:
- Mick Alberts | Escritor Técnico
- Ashish Chahuan | Arquiteto sênior de soluções de nuvem
- Brandon Cowen | Arquiteto sênior de soluções de nuvem
- Manjit Singh | Engenheiro de Software
- Christina Skarpathiotaki | Arquiteta sênior de soluções de nuvem
- Nathan Widdup | Engenheiro sênior de Fast-Track do Azure
Para ver perfis não públicos no LinkedIn, entre no LinkedIn.
Próximas etapas
- O que é o serviço de Fala?
- Postagem no blog das APIs de fala
- Roteiro de aprendizagem: provisionar e gerenciar os Serviços Cognitivos do Azure
- Roteiro de aprendizagem: processar e traduzir a fala com os Serviços de Fala Cognitiva do Azure
Recursos relacionados
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de