Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Asegúrese de que los agentes de inteligencia artificial se alinean de forma coherente con las instrucciones de usuario y los objetivos de tarea. La característica Cumplimiento de tareas identifica discrepancias, como invocaciones de herramientas desalineadas, entrada o salida de herramientas incorrectas en relación con la intención del usuario e incoherencias entre las respuestas y la entrada del cliente. Esta característica permite a los desarrolladores del sistema mitigar proactivamente las acciones desalineadas bloqueando o escalando el problema para la intervención humana.
Los objetivos principales de cumplimiento de tareas son:
- Para detectar acciones de las herramientas que están mal alineadas con los objetivos del usuario o con la intención de uso, o entradas o salidas de herramientas incorrectas respecto a la intención del usuario, o incoherencias entre las respuestas del agente y la entrada del cliente.
- Para proporcionar justificación cuando las llamadas a herramientas están desalineadas.
- Para proporcionar una señal para impedir la invocación de herramientas posteriores y la escalación a revisión con intervención humana cuando la alineación de tareas está en riesgo.
- Para promover la confianza del usuario en sistemas agente mediante el refuerzo de la coherencia del comportamiento, la transparencia y el control.
Escenarios de usuario
Servicio al cliente
Escenario: un bot de chat del asistente de soporte al cliente integrado en una plataforma empresarial ayuda a los usuarios a comprobar el uso de datos, solucionar problemas y administrar la configuración de la cuenta. Para mantener una automatización precisa, el sistema incorpora cumplimiento de tareas para validar los planes del agente antes de ejecutar llamadas a herramientas de back-end.
Usuario: usuarios finales, agentes de soporte técnico y equipos de experiencia del cliente.
Acción: un usuario le indica al bot de chat: "¿Puede comprobar cuántos datos he usado este mes?" El asistente planea invocar una change_data_plan() herramienta. Cumplimiento de tareas detecta una desalineación entre la intención del usuario (solicitud de información) y la acción propuesta (cambio de suscripción). La invocación de la herramienta se puede bloquear y el sistema detiene la ejecución o pide al usuario que lo revise.
Recursos humanos
Escenario: Un asistente virtual empresarial automatiza procesos rutinarios de trabajo relacionados con recursos humanos, como solicitar vacaciones, la presentación de gastos y la consulta de información sobre políticas. Adherencia de tareas garantiza que las acciones del agente se mantengan dentro del ámbito previsto y no realicen atajos no intencionados.
Usuario: empleados, asociados empresariales de RR. HH. y equipos de automatización de flujos de trabajo.
Acción: Un empleado escribe: "Quiero saber cuántas vacaciones anuales he dejado". El agente planea invocar apply_leave(). Adherencia a tareas identifica una desalineación de tareas: el usuario solicitó información, no iniciar un proceso. La ejecución está bloqueada y el agente reformula su mensaje o solicita confirmación.
Herramientas de productividad
Escenario: un bot de chat del asistente de productividad insertado en una plataforma de correo electrónico ayuda a los profesionales a conectarse a bases de datos y a redactar, revisar y enviar mensajes. La adhesión de tareas se usa para distinguir entre escribir un borrador y ejecutar un comando de envío, especialmente en los casos en los que la intención del usuario es ambigua.
Usuario: trabajadores del conocimiento, asistentes ejecutivos y equipos de cumplimiento de TI.
Acción: el usuario solicita: "Escriba un correo electrónico al cliente sobre la fecha límite perdida". El agente genera un mensaje y planea invocar send_email(). El seguimiento de tareas señala que el plan puede ser prematuro: no hay ninguna instrucción explícita para enviar. En su lugar, el sistema bloquea la llamada a la herramienta prevista y solicita la revisión del usuario.
Uso de herramientas alineadas frente a desalineadas
Esta señal de la API de cumplimiento de tareas ayuda a los desarrolladores y a los propietarios de la plataforma a comprender cuándo la invocación de herramientas de un agente coincide o se desvía de la intención del usuario.
Examples
| Classification | Acción | Example |
|---|---|---|
| Alineado | El agente recupera la información solicitada sin realizar ninguna acción no deseada. |
Usuario: "¿Puede mostrarme mis eventos de calendario recientes?" Herramienta planificada: get_calendar_events() ✅ El agente recupera eventos como se le pide. Salida: {"taskRiskDetected":false} |
| Desalineados | El agente intenta modificar la configuración del usuario cuando solo se realizó una solicitud de información. |
Usuario: "¿Puede mostrarme mis eventos de calendario recientes?" Herramienta planificada: clear_calendar_events() ❌ El agente se prepara para eliminar datos. Salida: {"taskRiskDetected": true,"details": "Planned action deletes calendar events, but user only requested to view them."} |
| Alineado | El agente inicia un flujo de creación de documentos después de que el usuario solicite generar un nuevo documento. |
Usuario: "Crear un nuevo documento de propuesta de proyecto para el cliente". Herramienta planeada: create_document() ✅ Coincide con la solicitud de tarea del usuario. Salida: {"taskRiskDetected": false } |
| Desalineados | El agente comparte el documento con colaboradores externos sin instrucciones de usuario. |
Usuario: "Crear un nuevo documento de propuesta de proyecto para el cliente". Herramienta prevista: compartir_documento() ❌ No hay instrucciones de usuario para compartir. Salida: {"taskRiskDetected": true, "details": "Agent attempts to share a document externally without user request or confirmation."} |
Limitaciones
Disponibilidad del idioma
El cumplimiento de tareas se prueba en texto en inglés. Sin embargo, la característica puede funcionar en muchos otros idiomas, pero la calidad puede variar. En todos los casos, se recomienda probar el caso de uso y la aplicación para asegurarse de que funciona para sus escenarios.
Limitación de longitud de texto
Consulte Requisitos de entrada para conocer las limitaciones máximas de longitud de texto.
Disponibilidad de regiones y procesamiento de datos
Aunque la adhesión a tareas se puede habilitar en todas las regiones de seguridad de contenido de Azure AI, los datos del cliente se pueden enrutar y procesar en regiones de EE. UU. y la UE fuera de su región especificada.