Compartir a través de


Componentes de ejecución en tiempo real del agente

Los componentes en tiempo de ejecución del agente son los objetos principales (agentes, conversaciones y respuestas) que potencian las interacciones multiturno y con estado en el servicio Microsoft Foundry Agent. Juntos, estos componentes permiten generar salidas, conservar el estado entre turnos y crear aplicaciones conversacionales.

En este artículo se explican los roles de un agente, una conversación y una respuesta, y cómo funcionan juntos durante la generación de respuestas.

Prerrequisitos

Funcionamiento conjunto de componentes en tiempo de ejecución

Al trabajar con un agente, sigue un patrón coherente:

  • Crear un agente: defina un agente para empezar a enviar mensajes y recibir respuestas.
  • Crear una conversación (opcional): use una conversación para mantener el historial a través de turnos. Si no usa una conversación, mantenga el contexto utilizando el resultado de una respuesta anterior.
  • Generar una respuesta: el agente procesa los elementos de entrada en la conversación y las instrucciones proporcionadas en la solicitud. El agente puede anexar elementos a la conversación.
  • Comprobar el estado de la respuesta: supervise la respuesta hasta que finalice (especialmente en modo de streaming o en segundo plano).
  • Recuperar la respuesta: muestra la respuesta generada al usuario.

En el diagrama siguiente se muestra cómo interactúan estos componentes en un bucle de agente típico.

Diagrama que muestra el bucle de tiempo de ejecución del agente: una definición del agente y la generación de respuestas a partir de un historial de conversaciones, opcionalmente, que puede llamar a herramientas, añadir elementos a la conversación y producir elementos de salida que se presenten al usuario.

Proporciona entradas de usuario (y, opcionalmente, historial de conversaciones), el servicio genera una respuesta (incluidas las llamadas a herramientas cuando se configura) y los elementos resultantes se pueden reutilizar como contexto para el siguiente turno.

¿Qué es un agente?

Un agente es una definición de orquestación persistente que combina modelos de IA, instrucciones, código, herramientas, parámetros y controles opcionales de seguridad o gobernanza.

Almacene agentes como activos con versiones y con nombre en Microsoft Foundry. Durante la generación de respuestas, la definición del agente funciona con el historial de interacción (conversación o respuesta anterior) para procesar y responder a la entrada del usuario.

¿Qué es una conversación?

Una conversación administra el estado automáticamente, por lo que no es necesario pasar entradas manualmente para cada turno.

Las conversaciones son objetos duraderos con identificadores únicos. Después de la creación, puede reutilizarlos entre sesiones.

Las conversaciones almacenan elementos, que pueden incluir mensajes, llamadas a herramientas, salidas de herramientas y otros datos.

Cuándo usar una conversación

Use una conversación cuando desee:

  • Continuidad multiturno: mantenga un historial estable a través de turnos sin recompilar el contexto usted mismo.
  • Continuidad entre sesiones: reutilice la misma conversación para un usuario que devuelva más adelante.
  • Depuración más sencilla: inspeccione lo que ha ocurrido a lo largo del tiempo (por ejemplo, llamadas y salidas de herramientas).

Si no crea una conversación, todavía puede desarrollar flujos de varios turnos utilizando la salida de una respuesta anterior como punto de partida para la siguiente solicitud. Este enfoque proporciona más flexibilidad que el patrón basado en subprocesos anterior, donde el estado estaba estrechamente acoplado a los objetos de subproceso. Para obtener instrucciones de migración, consulte Migración al SDK de agentes.

Elementos de conversación

Las conversaciones almacenan elementos en lugar de solo mensajes de chat. Los elementos capturan lo que sucedió durante la generación de respuesta para que el siguiente turno pueda reutilizar ese contexto.

Entre los tipos de elementos comunes se incluyen:

  • Elementos de mensaje: mensajes de usuario o asistente.
  • Elementos de invocación de herramientas: registros de invocaciones de herramienta que intentó el agente.
  • Elementos de salida de la herramienta: salidas devueltas por herramientas (por ejemplo, resultados de recuperación).
  • Elementos de salida: el contenido de respuesta que se muestra de nuevo al usuario.

Para obtener ejemplos que muestran cómo funcionan juntas las conversaciones y las respuestas en el código, consulte Creación y uso de memoria en foundry Agent Service.

Funcionamiento de las respuestas

La generación de respuestas invoca al agente. El agente usa su configuración y cualquier historial proporcionado (conversación o respuesta anterior) para realizar tareas mediante una llamada a modelos y herramientas. Como parte de la generación de respuestas, el agente anexa elementos a la conversación.

También puede generar una respuesta sin definir un agente. En este caso, proporcionará todas las configuraciones directamente en la solicitud y las usará solo para esa respuesta. Este enfoque es útil para escenarios sencillos con herramientas mínimas.

Streaming y respuestas en segundo plano

Algunos modos de generación de respuesta devuelven resultados incrementales (streaming) o completos de forma asincrónica (en segundo plano). En estos casos, normalmente se supervisa la respuesta hasta que finaliza y, a continuación, se consumen los elementos de salida finales.

Para obtener más información sobre los modos de respuesta y cómo consumir resultados, consulte API de respuestas.

Seguridad y control de datos

Dado que las conversaciones y respuestas pueden conservar las salidas de herramientas y contenido proporcionados por el usuario, trate los datos en tiempo de ejecución como los datos de la aplicación:

  • Evite almacenar secretos en mensajes o historial de conversaciones. Use conexiones y almacenes de secretos administrados en su lugar (por ejemplo, Configurar una conexión de Key Vault).
  • Use privilegios mínimos para el acceso a herramientas. Cuando una herramienta accede a sistemas externos, el agente puede leer o enviar datos a través de esa herramienta.
  • Tenga cuidado con los servicios que no son de Microsoft. Si el agente llama a herramientas respaldadas por servicios que no son de Microsoft, algunos datos pueden fluir a esos servicios. Para conocer las consideraciones relacionadas, consulte Descubrir herramientas en Foundry Tools.

Límites y restricciones

Los límites pueden depender del modelo, la región y las herramientas que adjunte (por ejemplo, la disponibilidad de streaming y la compatibilidad con herramientas). Para obtener disponibilidad y restricciones actuales para las respuestas, consulte Api de respuestas.