Sdílet prostřednictvím


Vylepšení testování agentů pomocí sady Copilot Studio Kit

Sada Power CAT Copilot Studio Kit je uživatelsky přívětivá aplikace, která umožňuje ověřit odpovědi agenta. Zahrnuje také nativní funkce, jako je export a import Excelu pro hromadné vytváření a aktualizace.

Konfigurace, spuštění a analýza

Nakonfigurujte a spusťte testy s rozhraními API aplikace Copilot Studio (rozhraní API direct line), abyste vyhodnotili odpovědi agenta na očekávané výsledky.

Pokud chcete rozšířit výsledky, získejte další datové body z Azure Application Insights a Dataverse analýzou záznamů přepisů konverzace, jako například přesného názvu tématu a skóre identifikace záměru.

U odpovědí generovaných umělou inteligencí, které jsou ze své podstaty nedeterministické, použijte výzvy k porovnání vygenerované odpovědi s ukázkovou odpovědí nebo pokyny k ověření.

Diagram znázorňující komponenty Azure a Power Platform, které se podílejí na testování a analýze rozhraní API Direct Line aplikace Copilot Studio, včetně Azure Application Insights, AI Builderu a Dataverse

Typy testů

Nástroj podporuje tyto typy testů:

  • Výsledek shody odpovědí
  • Přílohy, jako jsou adaptivní karty
  • Shoda tématu (vyžaduje Dataverse)
  • Generování odpovědí (vyžaduje AI Builder pro analýzu odpovědí a Application Insights, kde najdete podrobnosti o tom, proč nebyla odpověď vygenerována)
  • Rozvětvený typ testu je speciální typ testu. Skládá se ze sady testovacích případů běžných typů, které běží v zadaném pořadí ve stejném kontextu konverzace. Pomocí testů s více kroky otestujte scénáře od začátku do konce a proveďte testování vlastních agentů pomocí generativní orchestrace.
  • Ověření plánu umožňuje vývojářům ověřit, že vlastní agenti, kteří používají generativní orchestraci, zahrnují očekávané nástroje. Místo vyhodnocení toho, co agent říká, tento testovací typ kontroluje, že dynamický plán agenta zahrnuje očekávané nástroje (nástroje, akce a připojené agenty) k předem stanovené prahové hodnotě.

Přečtěte si další informace o typech testů v nástroji Configure tests in Copilot Studio Kit.

Snímek obrazovky s podrobnostmi o výsledku spuštění testu, včetně obrázku znázorňující úspěšnost a latenci všech testovacích běhů

Další krok