Compartilhar via


Início rápido: ouvir e falar com modelos de chat no playground de chat do Estúdio de IA

Dê ao seu aplicativo a capacidade de ouvir e falar emparelhando o Serviço OpenAI do Azure com a Fala de IA do Azure para proporcionar interações mais sofisticadas.

Neste início rápido, você usará o Serviço OpenAI do Azure e a Fala de IA do Azure para:

  • Falar com o assistente por meio da conversão de fala em texto.
  • Ouvir a resposta do assistente por meio da conversão de texto em fala.

Os recursos de fala em texto e texto em fala podem ser usados em conjunto ou separadamente no playground de chat do Estúdio de IA. Use o playground para testar seu modelo de chat antes de implantá-lo.

Pré-requisitos

Configurar o playground de chat

Antes de iniciar uma sessão de chat, você precisa configurar o playground de chat para usar os recursos de fala em texto e texto em fala.

  1. Entre no Azure AI Studio.

  2. Acesse seu projeto ou crie um projeto no Estúdio de IA do Azure.

  3. Selecione Chat na lista de playgrounds.

  4. Selecione o modelo de chat implantado na lista suspensa Implantação.

    Captura de tela do playground de chat com o modo e a implantação realçados.

  5. Selecione o botão Recursos de chat.

    Captura de tela do playground de chat com opções para acessar as configurações de recursos de chat.

    Observação

    Você também verá as opções para selecionar os botões de microfone ou alto-falante. Se você selecionar um desses botões, mas ainda não tiver habilitado a conversão de fala em texto ou conversão de texto em fala, será solicitado que você os habilite em Recursos de chat.

  6. Na página Recursos de chat, selecione a caixa para reconhecer que o uso do recurso de fala incorrerá em custos adicionais. Para obter mais informações, consulte Preços do Azure AI Speech.

  7. Selecione Habilitar conversão de fala em texto e Habilitar conversão de texto em fala.

    Captura de tela da página de recursos de chat.

  8. Escolha a localidade do idioma e a voz que deseja usar para falar e ouvir. A lista de vozes disponíveis depende da localidade selecionada.

  9. Opcionalmente, você pode experimentar a voz antes de retornar à sessão de chat. Insira um texto de amostra e selecione Reproduzir para

  10. Selecione Salvar.

Iniciar uma sessão de chat

Nesta sessão de chat, você usará a conversão de fala em texto e a conversão de texto em fala. Use o recurso de conversão de fala em texto para falar com o assistente e o recurso de conversão de texto em fala para ouvir a resposta dele.

  1. Conclua as etapas descritas na seção Configurar o playground caso ainda não tenha feito isso. Para concluir este início rápido, você precisará habilitar os recursos de conversão de fala em texto e conversão de texto em fala.

  2. Selecione o botão de microfone e fale com o assistente. Por exemplo, você pode perguntar “Você sabe onde posso comprar um Xbox?”.

    Captura de tela da sessão de chat com o ícone de microfone habilitado e o botão enviar realçado.

  3. Selecione o botão Enviar (seta para a direita) para enviar a mensagem ao assistente. A resposta do assistente será exibida no painel da sessão de chat.

    Captura de tela da sessão de chat com a resposta do assistente.

    Observação

    Se o botão de alto-falante estiver ativado, você ouvirá a resposta do assistente. Se o botão de alto-falante estiver desativado, você não ouvirá a resposta do assistente, mas a resposta ainda será exibida no painel da sessão de chat.

  4. Você poderá alterar o prompt do sistema para alterar o formato ou o estilo de resposta do assistente.

    Por exemplo, insira:

    "You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
    

    A resposta é mostrada no painel da sessão de chat. Como o botão de alto-falante está ativado, você também ouve a resposta.

    Captura de tela da sessão de chat com o prompt do sistema editado.

Exibir código de exemplo

Selecione o botão Exibir Código para visualizar e copiar o código de exemplo, que inclui a configuração para os serviços de Fala e OpenAI do Azure.

Captura de tela do botão para exibir o código de exemplo no playground.

Use o código de exemplo para habilitar a conversão de fala em texto e a conversão de texto em fala no aplicativo.

Captura de tela da exibição do código no playground.

Dica

Para ver outro exemplo, confira o exemplo de código de chat da conversão de fala em fala.

Limpar os recursos

Para evitar gerar custos desnecessários no Azure, exclua os recursos criados neste início rápido, caso eles não sejam mais necessários. Para gerenciar os recursos, use o portal do Azure.

Próximas etapas