Comparteix a través de


Inicio rápido: Escuche y hable con modelos de chat en el área de juegos de chat de AI Studio

Ofrezca a la aplicación la capacidad de escuchar y hablar uniendo Azure OpenAI Service con Voz de Azure AI para permitir interacciones más enriquecidas.

En este inicio rápido, usará Azure OpenAI Service y Voz de Azure AI para:

  • Hablar con el asistente a través de la conversión de voz en texto.
  • Escuchar la respuesta del asistente mediante texto a voz.

Las características de conversión de voz en texto y texto a voz se pueden usar juntas o por separado en el área de juegos de chat de AI Studio. Puede usar el área de juegos para probar el modelo de chat antes de implementarlo.

Requisitos previos

Configuración del área de juegos de chat

Para poder iniciar una sesión de chat, debe configurar el área de juegos de chat para usar las características de conversión de voz en texto y texto a voz.

  1. Inicie sesión en Azure AI Studio.

  2. Vaya al proyecto o cree un nuevo proyecto en Inteligencia artificial de Azure Studio.

  3. Seleccione Chat en la lista de áreas de juegos.

  4. Seleccione el modelo de chat implementado en la lista desplegable Implementación.

    Captura de pantalla del área de juegos de chat con el modo y la implementación resaltados.

  5. Seleccione el botón Funcionalidades de chat.

    Recorte de pantalla del área de juegos de chat con opciones para acceder a la configuración de funcionalidades de chat.

    Nota:

    También debería ver las opciones para seleccionar los botones del micrófono o del altavoz. Si selecciona cualquiera de estos botones, pero aún no ha activado la conversión de voz a texto o de texto a voz, se le pedirá que los active en las Funcionalidades de chat.

  6. En la página de Funcionalidades de chat, seleccione la casilla para reconocer que el uso de la función de voz conllevará costes adicionales. Para obtener más información, consulte Precios de Voz de Azure AI.

  7. Seleccione Habilitar conversión de voz en texto y Habilitar texto a voz.

    Recorte de pantalla de la página de funcionalidades de chat.

  8. Seleccione la configuración regional del idioma y la voz que desea usar para hablar y escuchar. La lista de voces disponibles depende de la configuración regional que seleccione.

  9. Opcionalmente, puedes probar la voz antes de volver a la sesión de chat. Escriba algún texto de ejemplo y seleccione Reproducir en

  10. Seleccione Guardar.

Iniciar una sesión de chat

En esta sesión de chat, usará conversión de voz en texto y texto a voz. Usará la característica de conversión de voz en texto para hablar con el asistente y la característica de texto a voz para escuchar la respuesta del asistente.

  1. Complete los pasos descritos en la sección Configurar el área de juegos si aún no lo ha hecho. Para completar este inicio rápido, debe habilitar las características de conversión de voz en texto y texto a voz.

  2. Seleccione el botón de micrófono y hable con el asistente. Por ejemplo, puede decir "¿Sabes dónde puedo obtener una Xbox?".

    Captura de pantalla de la sesión de chat con el icono de micrófono habilitado y el botón enviar resaltado.

  3. Seleccione el botón de enviar (flecha derecha) para enviar el mensaje al asistente. La respuesta del asistente se muestra en el panel de sesión de chat.

    Captura de pantalla de la sesión de chat con la respuesta del asistente.

    Nota:

    Si el botón del altavoz está activado, escuchará la respuesta del asistente. Si el botón del altavoz está desactivado, no escuchará la respuesta del asistente, pero esta se mostrará en el panel de sesión de chat.

  4. Puede cambiar la solicitud del sistema para cambiar el formato o estilo de respuesta del asistente.

    Por ejemplo, escriba:

    "You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
    

    La respuesta se mostrará en el panel de sesión de chat. Dado que el botón del altavoz está activado, también escuchará la respuesta.

    Captura de pantalla de la sesión de chat con el símbolo del sistema editado.

Ver código de ejemplo

Puede seleccionar el botón Ver códigopara ver y copiar el código de ejemplo, que incluye la configuración de los servicios de Voz y Azure OpenAI.

Captura de pantalla del botón para ver el código de ejemplo en el área de juegos.

Puede usar el código de ejemplo para habilitar la conversión de voz en texto y texto a voz en la aplicación.

Captura de pantalla de visualización del código en el área de juegos.

Sugerencia

Consulte otro ejemplo de código de chat de voz a voz.

Limpieza de recursos

Para evitar incurrir en costes innecesarios de Azure, debe eliminar los recursos que creó en este inicio rápido si ya no son necesarios. Para administrar recursos, puede usar Azure Portal.

Pasos siguientes