Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
[Questo articolo fa parte della documentazione non definitiva, pertanto è soggetto a modifiche.]
Utilizzando i risultati del set di test, puoi ottimizzare il comportamento del tuo agente e verificare che soddisfi i requisiti di business e qualità. Puoi anche eseguire set di test più volte per confrontare i risultati man mano che migliori il tuo agente.
I risultati dei test sono disponibili presso Copilot Studio per 89 giorni. Per salvare i risultati dei test per un periodo più lungo, esporta i risultati in un file CSV.
Importante
Questo articolo contiene la documentazione sull'anteprima di Microsoft Copilot Studio ed è pertanto soggetto a modifiche.
Le funzionalità di anteprima non sono progettate per l'uso in produzione e possono avere funzionalità limitate. Queste funzionalità sono disponibili prima di una versione ufficiale in modo che sia possibile ottenere l'accesso iniziale e inviare commenti.
Se stai creando un agente destinato alla produzione, vedi Panoramica di Microsoft Copilot Studio.
Eseguire un set di test
Dopo aver creato un set di test, puoi eseguirlo o riavviarlo per confrontare i risultati nel tempo e nelle iterazioni. Un test può richiedere fino a pochi minuti per essere eseguito. Puoi eseguire un test alla volta.
Importante
Le valutazioni degli agenti che utilizzano l'autenticazione utente richiedono l'accesso tramite il connettore Microsoft Copilot Studio. Se il tuo amministratore disattiva questa connessione, non puoi eseguire test usando lo strumento di valutazione. Per ulteriori informazioni, vedi connettori e gruppi dati Copilot Studio.
Vai alla pagina Valutazione del tuo agente.
Esegui un test eseguendo una delle seguenti azioni:
- Alla fine della creazione o modifica di un set di test, seleziona Valuta.
- Nella sezione Risultati recenti , puoi valutare i risultati dei test facendo una delle seguenti cose:
- Passa il mouse sul risultato del test che vuoi valutare, seleziona i tre punti (...) e poi seleziona di nuovo Valuta set di test.
- Seleziona il risultato del test per aprirlo, poi seleziona i tre punti (...) nel pannello riepilogo della valutazione , e infine seleziona di nuovo Valuta set di test.
Se il profilo utente del set di test ha connessioni rotte, o se il set di test non ha un profilo utente, appare la finestra di dialogo Gestisci connessioni . Non è necessario usare un profilo utente per i test. Tuttavia, se usi un profilo, tutte le connessioni devono funzionare. Per informazioni su come riparare le connessioni, vedi Gestisci profili utente e connessioni.
Una valutazione può richiedere alcuni minuti. Un avviso appare in Copilot Studio quando i risultati del test sono pronti per essere visualizzati.
Approfondisci i risultati dei test
Ogni volta che esegui una valutazione con un set di test, Copilot Studio:
Usa l'account utente connesso per simulare le conversazioni con l'agente, inviando ogni domanda nel test case all'agente.
Raccoglie le risposte dell'agente.
Misura e analizza il successo di ogni risposta. Ogni test case riceve un valore Superato o Non superato in base ai criteri del test case.
Assegna un punteggio di tasso di superamento in base al tasso di superamento/ e al tasso di mancato superamento del set di test.
Puoi vedere il tasso di superamento di ogni set di test eseguito nella pagina Valutazione del tuo agente, sotto Risultati recenti. Per visualizzare più esecuzioni del set di test, seleziona Vedi tutto.
Vedi un'analisi dettagliata per un caso di prova
Quando apri un risultato di test, puoi vedere i dettagli della prova, una lista delle query usate nel test, come ha risposto l'agente e il punteggio Pass or Fail .
Seleziona un caso di prova nell'elenco per vedere una valutazione dettagliata di ogni risposta.
La valutazione include le risposte attese e reali, il ragionamento dietro il risultato del test e le conoscenze, gli argomenti e gli strumenti utilizzati dall'agente per rispondere.
Seleziona una conoscenza o un argomento citato per aprirlo.
Confronta i risultati dei test
Vuoi testare una versione del tuo agente e vedere i cambiamenti nelle prestazioni prima e dopo aver effettuato le modifiche. Puoi confrontare due esecuzioni dello stesso set di test usando lo strumento Confronto con .
Per vedere un confronto, devi eseguire lo stesso set di test almeno due volte.
Nella pagina Valutazione del tuo agente, apri la prova che vuoi usare come base per il confronto, sotto Risultati recenti dei test.
Seleziona il menu a tendina Confronta con , poi seleziona l'ora e la data del test che vuoi confrontare con i risultati attualmente aperti.
Nell'elenco dei casi di test , le frecce mostrano quali risultati di caso di test sono migliorati passando da fallimento a superatore
, oppure diminuiti passando da superato a fallito
.
Seleziona un caso di prova per vedere maggiori dettagli. Nel pannello riassunto della Valutazione puoi vedere un confronto diretto tra i punteggi del test, con il risultato del test attuale in cima.
Esportare i risultati dei test
Puoi esportare i risultati dei test in un file CSV. Il file elenca la domanda, la risposta attesa (se applicabile), il metodo di test, il punteggio di superamento (se applicabile), la risposta dell'agente, il risultato del test e l'analisi per ogni caso di test.
- Vai alla pagina Valutazione del tuo agente.
- Nella sezione Risultati recenti , puoi esportare un risultato di test facendo una delle seguenti cose:
- Passa il mouse sopra il caso di test che vuoi esportare, seleziona i tre punti (...) e poi seleziona Esporta risultati del test.
- Seleziona il caso di test per aprirlo, poi seleziona i tre punti (...) nel pannello riepilogo Valutazione , e infine seleziona Esporta risultati del test.
I risultati del test scaricano come nome del tuo set di test.csv.