Comparteix a través de


Inicio rápido: escuche y hable con modelos de chat en el área de juegos de chat de Azure AI Foundry

En el área de juegos de chat del portal de Azure AI Foundry, puede usar las características de conversión de voz en texto y de texto a voz para interactuar con los modelos de chat. Puede probar el mismo modelo que usa para el chat basado en texto en un chat basado en voz. Es simplemente otra manera de interactuar con el modelo.

En este inicio rápido, usará Azure OpenAI Service y Voz de Azure AI para:

  • Hablar con el asistente a través de la conversión de voz en texto.
  • Escuchar la respuesta del asistente mediante texto a voz.

Las características de conversión de voz en texto y texto a voz se pueden usar juntas o por separado en el área de juegos de chat del portal de Azure AI Foundry. Puede usar el área de juegos para probar el modelo de chat antes de implementarlo.

Requisitos previos

Configuración del área de juegos de chat

Para poder iniciar una sesión de chat, debe configurar el área de juegos de chat para usar las características de conversión de voz en texto y texto a voz.

  1. Inicie sesión en Azure AI Foundry.

  2. Vaya al proyecto de Azure AI Foundry. Si necesita crear un proyecto, consulte Crear un proyecto de Azure AI Foundry.

  3. Seleccione Áreas de juegos en el panel izquierdo y, a continuación, seleccione el área de juegos que desea usar. En este ejemplo, seleccione Probar el área de juegos de chat.

  4. Seleccione el modelo de chat implementado en la lista desplegable Implementación.

    Captura de pantalla del área de juegos de chat con el modo y la implementación resaltados.

  5. Seleccione el botón Funcionalidades de chat.

    Recorte de pantalla del área de juegos de chat con opciones para acceder a la configuración de funcionalidades de chat.

    Nota:

    También debería ver las opciones para seleccionar los botones del micrófono o del altavoz. Si selecciona cualquiera de estos botones, pero aún no ha activado la conversión de voz a texto o de texto a voz, se le pedirá que los active en las Funcionalidades de chat.

  6. En la página de Funcionalidades de chat, seleccione la casilla para reconocer que el uso de la función de voz conllevará costes adicionales. Para obtener más información, consulte Precios de Voz de Azure AI.

  7. Seleccione Habilitar conversión de voz en texto y Habilitar texto a voz.

    Recorte de pantalla de la página de funcionalidades de chat.

  8. Seleccione la configuración regional del idioma y la voz que desea usar para hablar y escuchar. La lista de voces disponibles depende de la configuración regional que seleccione.

  9. Opcionalmente, puedes probar la voz antes de volver a la sesión de chat. Escriba algún texto de ejemplo y seleccione Reproducir en

  10. Seleccione Guardar.

Iniciar una sesión de chat

En esta sesión de chat, usará conversión de voz en texto y texto a voz. Usará la característica de conversión de voz en texto para hablar con el asistente y la característica de texto a voz para escuchar la respuesta del asistente.

  1. Complete los pasos descritos en la sección Configurar el área de juegos si aún no lo ha hecho. Para completar este inicio rápido, debe habilitar las características de conversión de voz en texto y texto a voz.

  2. Seleccione el botón de micrófono y hable con el asistente. Por ejemplo, puede decir "¿Sabes dónde puedo obtener una Xbox?".

    Captura de pantalla de la sesión de chat con el icono de micrófono habilitado y el botón enviar resaltado.

  3. Seleccione el botón de enviar (flecha derecha) para enviar el mensaje al asistente. La respuesta del asistente se muestra en el panel de sesión de chat.

    Nota:

    Si el botón del altavoz está activado, escuchará la respuesta del asistente. Si el botón del altavoz está desactivado, no escuchará la respuesta del asistente, pero esta se mostrará en el panel de sesión de chat.

  4. Puede cambiar la solicitud del sistema para cambiar el formato o estilo de respuesta del asistente.

    Por ejemplo, escriba:

    "You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
    

    Diga otra vez: "¿Sabes dónde puedo conseguir una Xbox?". La respuesta se mostrará en el panel de sesión de chat. Dado que el botón del altavoz está activado, también escuchará la respuesta.

    Captura de pantalla de la sesión de chat con el símbolo del sistema editado.

Limpieza de recursos

Para evitar incurrir en costes innecesarios de Azure, debe eliminar los recursos que creó en este inicio rápido si ya no son necesarios. Para administrar recursos, puede usar Azure Portal.

Pasos siguientes