O que é a CLI de Voz?

A CLI de Fala é uma ferramenta de linha de comando para usar o serviço de Fala sem precisar escrever nenhum código. A CLI de fala requer configuração mínima. Você pode usá-lo facilmente para experimentar os principais recursos do serviço de fala e ver como ele funciona com seus casos de uso. Em poucos minutos, você pode executar fluxos de trabalho de teste simples, como reconhecimento de fala em lote de um diretório de arquivos ou conversão de texto em fala em uma coleção de cadeias de caracteres de um arquivo. Além de fluxos de trabalho simples, a CLI de fala está pronta para produção e você pode dimensioná-la para executar processos maiores usando scripts automatizados .bat ou shell.

A maioria das funcionalidades do SDK de Voz estão disponíveis na CLI de Voz e algumas funcionalidades e personalizações avançadas são simplificadas na CLI de Voz. Ao decidir quando usar a CLI de Fala ou o SDK de Fala, considere as orientações a seguir.

Utilize a CLI de Voz quando:

  • Você deseja experimentar os recursos do serviço de fala com configuração mínima e sem precisar escrever código.
  • Você tem requisitos relativamente simples para um aplicativo de produção que usa o serviço de fala.

Utilize o SDK de Voz quando:

  • Você deseja integrar a funcionalidade do serviço de fala em uma linguagem ou plataforma específica (por exemplo, C#, Python ou C++).
  • Você tem requisitos complexos que podem exigir solicitações de serviço avançadas.
  • Você está desenvolvendo um comportamento personalizado, incluindo streaming de respostas.

Principais características

  • Reconhecimento de fala: converta fala em texto a partir de arquivos de áudio ou diretamente de um microfone, ou transcreva uma conversa gravada.

  • Síntese de fala: converta texto em fala usando a entrada de arquivos de texto ou inserindo diretamente da linha de comando. Personalize as características de saída de fala usando configurações de SSML (Speech Synthesis Markup Language).

  • Tradução de fala: traduza áudio em um idioma de origem para texto ou áudio em um idioma de destino.

  • Executar em recursos de computação do Azure: Enviar comandos da CLI de Fala para serem executados em um recurso de computação remota do Azure usando spx webjobo .

Começar

Para começar a usar a CLI de fala, consulte o guia de início rápido. Este artigo mostra como executar alguns comandos básicos. Ele também oferece comandos um pouco mais avançados para executar operações em lote de fala para texto e texto para fala. Depois de ler o artigo básico, você deve entender a sintaxe o suficiente para começar a escrever alguns comandos personalizados ou automatizar operações simples do serviço de fala.

Próximos passos