Sdílet prostřednictvím


Spouštět testy a zobrazit výsledky

[Tento článek téma představuje předběžnou dokumentaci a může se změnit.]

Spusť a analyzuj výsledky hodnocení, abys optimalizoval chování svého makléře a ověřil, že agent splňuje požadavky na vaše podnikání a kvalitu. Můžete také opakovaně spustit testovací sadu, abyste viděli změny v průběhu času, jak svého agenta vylepšujete.

Výsledky testů jsou dostupné ve studiu Copilot po dobu 89 dnů. Pro delší uložení výsledků testů je exportujte do CSV souboru.

Spuštění testovací sady

Po vytvoření testovací sady ji můžete spustit nebo znovu spustit, abyste porovnali výsledky v čase a iteracích. Test může trvat až několik minut. Můžete spustit jeden test najednou.

Důležité

Hodnocení agentů, která používají uživatelskou autentizaci, vyžadují přístup přes konektor Microsoft Copilot Studio. Pokud administrátor toto připojení vypne, nemůžete testy spouštět pomocí hodnotícího nástroje. Pro více informací viz konektory a datové skupiny Copilot Studio.

  1. Přejděte na stránku Hodnocení vašeho agenta.

  2. Spusť test jedním z následujících kroků:

    • Na konci vytváření nebo úpravy testovací sady vyberte Vyhodnocovat.
    • V sekci Nejnovější výsledky vyhodnoťte výsledky jedním z následujících postupů:
      • Najeďte myší na výsledek testu, který chcete vyhodnotit, vyberte tři tečky (...) a pak znovu vyberte Vyhodnocovat testovací množinu.
      • Vyberte výsledek testu, abyste ho otevřeli, poté vyberte tři tečky (...) v panelu souhrnu hodnocení a znovu vyberte Vyhodnocovat testovací sadu.

    Pokud má uživatelský profil testovací sady přerušená spojení, nebo testovací sada nemá uživatelský profil, objeví se dialog Spravovat spojení . Nemusíte používat uživatelský profil pro testování. Pokud ale používáte profil, všechna spojení musí fungovat. Pro informace o opravě připojení viz Správa uživatelských profilů a připojení.

Vyšetření může trvat několik minut. V Copilot Studio se objeví upozornění, když jsou výsledky testu připraveny k dispozici.

Ponořte se do výsledků testů

Pokaždé, když spustíte vyhodnocení pomocí testovací sady, Copilot Studio:

  1. Používá připojený uživatelský účet k simulaci konverzací s agentem a posílá každou otázku v testovacím případu agentům.

  2. Shromažďuje odpovědi agenta.

  3. Měří a analyzuje úspěšnost každé odpovědi. Každý testovací případ obdrží hodnotu Úspěch nebo Neúspěch na základě kritérií testovacího případu.

  4. Přiřadí skóre úspěšnosti na základě míry úspěšnosti/ a selhání testovací sady.

Úspěšnost každé testovací sady můžete vidět na stránce Hodnocení vašeho agenta, v sekci Nedávné výsledky. Pokud chcete zobrazit více spuštění testovací sady, vyberte Zobrazit vše.

Snímek obrazovky zobrazující seznam předchozích hodnocení.

Podívejte se na podrobnou analýzu testovacího případu

Když otevřete výsledek testu, můžete vidět podrobnosti o testu, seznam dotazů použitých v testu, jak agent reagoval, a skóre Pass or Fail .

Vyberte testovací případ ze seznamu a zobrazte podrobné hodnocení každé odpovědi.

Snímek obrazovky zobrazující seznam testovacích případů v rámci dokončeného vyhodnocení.

Hodnocení zahrnuje očekávané i skutečné odpovědi, důvody za výsledkem testu a znalosti, témata a nástroje, které agent použil k odpovědi.

Vyberte citovanou znalost nebo téma pro otevření.

Snímek obrazovky znázorňující podrobný výsledek a vyhodnocení testovacího případu.

Porovnejte výsledky testů

Chcete otestovat jednu verzi svého agenta a vidět změny ve výkonu před i po provedení změn. Můžete porovnat dva běhy stejné testovací sady pomocí nástroje Porovnání s (Comparison with ).

Pro srovnání musíte spustit stejnou testovací sadu alespoň dvakrát.

  1. Na stránce Hodnocení vašeho agenta, v sekci Nedávné výsledky testů, otevřete testovací sérii, kterou chcete použít jako základ pro porovnání.

  2. Vyberte rozbalovací nabídku Porovnání s testem a poté čas a datum testovacího spuštění, které chcete porovnat s aktuálně otevřenými výsledky testu.

Screenshot ukazující rozbalovací nabídku Porovnat s ním.

V seznamu testovacích případů šipky ukazují, které výsledky testovacích případů se zlepšily změnou z neúspěšného na úspěšný , nebo klesly změnou z úspěšného na neúspěšný .

Vyberte testovací případ pro více podrobností. V panelu souhrnu hodnocení můžete vidět přímé srovnání výsledků testu, přičemž je na vrchu výsledek aktuálního testu.

Screenshot ukazující porovnání výsledků dvou testovacích sad.

Export výsledků testu

Výsledky testů můžete exportovat do CSV souboru. Soubor uvádí otázku, očekávanou odpověď (pokud je to relevantní), metodu testu, úspěšné skóre (pokud je to relevantní), odpověď agenta, výsledek testu a analýzu pro každý testovací případ.

  1. Přejděte na stránku Hodnocení vašeho agenta.
  2. V sekci Nedávné výsledky můžete exportovat výsledek testu jedním z následujících kroků:
    • Najeďte myší na testovací případ, který chcete exportovat, vyberte tři tečky (...) a pak vyberte Exportovat výsledky testu.
    • Vyberte testovací případ pro jeho otevření, poté vyberte tři tečky (...) v panelu Hodnocení a poté vyberte Exportovat výsledky testu.

Výsledky testu se stahují jako název vaší testovací sady.csv.