Compartir a través de


Haz pruebas y consulta los resultados

[Este artículo es documentación preliminar y está sujeto a modificaciones].

Utilizando los resultados del conjunto de pruebas, puedes optimizar el comportamiento de tu agente y validar que cumple con tus requisitos de negocio y calidad. También puedes ejecutar conjuntos de prueba varias veces para comparar resultados a medida que mejoras a tu agente.

Los resultados de las pruebas están disponibles en Copilot Studio durante 89 días. Para guardar los resultados de tus pruebas durante un periodo más largo, exporta los resultados a un archivo CSV.

Importante

Este artículo contiene la documentación de la versión preliminar de Microsoft Copilot Studio y está sujeto a modificaciones.

Las características en versión preliminar no están pensadas para su uso en producción y pueden tener funcionalidad restringida. Estas características están disponibles antes del lanzamiento oficial para que pueda tener acceso anticipado y proporcionar comentarios.

Si está creando un agente listo para producción, consulte Información general sobre Microsoft Copilot Studio.

Ejecutar un conjunto de pruebas

Después de crear un conjunto de prueba, puedes ejecutarlo o volver a ejecutarlo para comparar resultados a lo largo del tiempo y las iteraciones. Una prueba puede tardar hasta unos minutos. Puedes hacer una prueba a la vez.

Importante

Las evaluaciones de agentes que utilizan autenticación de usuario requieren acceso a través del conector Microsoft Copilot Studio. Si tu administrador desactiva esta conexión, no puedes hacer pruebas usando la herramienta de evaluación. Para más información, véase conectores y grupos de datos de Copilot Studio.

  1. Ve a la página de Evaluación de tu agente.

  2. Realiza una prueba realizando una de las siguientes acciones:

    • Al final de crear o editar un conjunto de pruebas, selecciona Evaluar.
    • En la sección de Resultados Recientes , puedes evaluar los resultados de las pruebas haciendo cualquiera de las siguientes cosas:
      • Pasa el cursor sobre el resultado de la prueba que quieres evaluar, selecciona los tres puntos (...) y luego vuelve a seleccionar Evaluar conjunto de pruebas.
      • Selecciona el resultado de la prueba para abrirlo, luego selecciona los tres puntos (...) en el panel de resumen de Evaluación , y después vuelve a seleccionar Evaluar conjunto de pruebas.

    Si el perfil de usuario del conjunto de pruebas tiene conexiones rotas, o el conjunto de pruebas no tiene un perfil de usuario, aparece el cuadro de diálogo Gestionar conexiones . No tienes que usar un perfil de usuario para hacer pruebas. Sin embargo, si usas un perfil, todas las conexiones deben estar funcionando. Para información sobre cómo arreglar conexiones, consulte Gestionar perfiles de usuario y conexiones.

Una evaluación puede tardar unos minutos en realizarse. Aparece una alerta en Copilot Studio cuando los resultados de la prueba están listos para ver.

Profundiza en los resultados de las pruebas

Cada vez que ejecute una evaluación con un conjunto de pruebas, Copilot Studio:

  1. Usa la cuenta de usuario conectada para simular conversaciones con el agente, enviando cada pregunta en el caso de prueba al agente.

  2. Recopila las respuestas del agente.

  3. Mide y analiza el éxito de cada respuesta. Cada caso de prueba recibe una Aprobación o Error, en función de los criterios del caso de prueba.

  4. Asigna una puntuación de tasa de aprobado basada en la tasa de aprobado/ y fallo del conjunto de pruebas.

Puedes ver la tasa de aprobación de cada conjunto de pruebas en la página de Evaluación de tu agente, en Resultados recientes. Para ver más ejecuciones de prueba, seleccione Ver todos para ver más detalles del entorno.

Captura de pantalla que muestra una lista de evaluaciones anteriores.

Consulta un análisis detallado para un caso de prueba

Cuando abres un resultado de prueba, puedes ver los detalles de la prueba, una lista de las consultas usadas en la prueba, cómo respondió el agente y la puntuación de Aprobado o Suspenso .

Selecciona un caso de prueba en la lista para ver una evaluación detallada de cada respuesta.

Captura de pantalla que muestra una lista de casos de prueba dentro de una evaluación completada.

La evaluación incluye las respuestas esperadas y reales, el razonamiento detrás del resultado de la prueba, así como el conocimiento, temas y herramientas que el agente utilizó para responder.

Selecciona un conocimiento o tema citado para abrirlo.

Captura de pantalla que muestra el resultado detallado y la evaluación de un caso de prueba.

Comparar los resultados de las pruebas

Quieres probar una versión de tu agente y ver cambios en el rendimiento antes y después de hacer cambios. Puedes comparar dos ejecuciones del mismo conjunto de pruebas usando la herramienta Comparación con .

Para ver una comparación, necesitas ejecutar el mismo conjunto de pruebas al menos dos veces.

  1. En la página de Evaluación de tu agente, abre la prueba que quieres usar como base para la comparación, en Resultados recientes de pruebas.

  2. Selecciona el desplegable Comparar con y luego selecciona la hora y la fecha de la prueba que quieres comparar con los resultados de la prueba que están abiertos.

Captura de pantalla que muestra el desplegable Comparar con.

En la lista de casos de prueba , las flechas muestran qué resultados mejoraron al cambiar de fallar a aprobado , o disminuyeron al cambiar de aprobado a suspendido .

Selecciona un caso de prueba para ver más detalles. En el panel de resumen de evaluación , puedes ver una comparación directa de las puntuaciones de la prueba, con el resultado de la prueba actual en la parte superior.

Captura de pantalla que muestra los resultados comparados de dos conjuntos de prueba.

Exportación de resultados de pruebas

Puedes exportar los resultados de las pruebas a un archivo CSV. El archivo muestra la pregunta, la respuesta esperada (si procede), el método de prueba, la puntuación de aprobación (si corresponde), la respuesta del agente, el resultado de la prueba y el análisis de cada caso.

  1. Ve a la página de Evaluación de tu agente.
  2. En la sección de Resultados recientes , puedes exportar un resultado de prueba haciendo cualquiera de las siguientes cosas:
    • Pasa el cursor sobre el caso de prueba que quieres exportar, selecciona los tres puntos (...) y luego selecciona Exportar resultados de prueba.
    • Selecciona el caso de prueba para abrirlo, luego selecciona los tres puntos (...) en el panel de resumen de Evaluación , y después selecciona Exportar resultados de prueba.

Los resultados de la prueba descargan como nombre de tu conjunto de prueba.csv.