Udostępnij przez


Uruchamiaj testy i przeglądaj wyniki

[Ten artykuł stanowi wstępne wydanie dokumentacji i może ulec zmianie.]

Korzystając z wyników zestawu testowego, możesz zoptymalizować zachowanie swojego agenta i zweryfikować, czy spełnia wymagania biznesowe i jakościowe. Możesz też uruchamiać zestawy testowe wielokrotnie, aby porównać wyniki w miarę ulepszania swojego agenta.

Wyniki testów są dostępne w Copilot Studio przez 89 dni. Aby zapisać wyniki testów na dłuższy czas, wyeksportuj je do pliku CSV.

Ważne

Ten artykuł zawiera dokumentację usługi Microsoft Copilot Studio w wersji zapoznawczej i może ulec zmianie.

Funkcje w wersji zapoznawczej nie są przeznaczone do użytku produkcyjnego i mogą mieć ograniczone funkcje. Te funkcje są udostępniane przed oficjalnym wydaniem, dzięki czemu można szybciej uzyskać do nich dostęp i przekazać opinie na ich temat.

Jeśli kompilowany jest agent gotowy do użycia w środowiskach produkcyjnych, zobacz temat Omówienie usługi Microsoft Copilot Studio (produkcja).

Uruchamianie zestawu testów

Po utworzeniu zestawu testowego możesz go uruchomić lub powtórzyć, aby porównać wyniki w czasie i iteracjach. Test może trwać nawet kilka minut. Możesz przeprowadzić jeden test naraz.

Ważne

Oceny agentów wykorzystujące uwierzytelnianie użytkownika wymagają dostępu przez konektor Microsoft Copilot Studio. Jeśli administrator wyłączy to połączenie, nie możesz przeprowadzić testów za pomocą narzędzia ewaluacyjnego. Więcej informacji można znaleźć w artykule o konektorach Copilot Studio i grupach danych.

  1. Wejdź na stronę Ocena swojego agenta.

  2. Przeprowadź test, wykonując jedną z następujących czynności:

    • Na końcu tworzenia lub edytowania zestawu testowego wybierz Oceniaj.
    • W sekcji Najnowsze wyniki możesz ocenić wyniki testów, wykonując jedną z następujących czynności:
      • Najedź kursorem na wynik testu, który chcesz ocenić, wybierz trzy kropki (...), a następnie ponownie wybierz Evaluate set test.
      • Wybierz wynik testu, aby go otworzyć, następnie wybierz trzy kropki (...) w panelu podsumowania oceny , a następnie ponownie wybierz Evaluate set testów.

    Jeśli profil użytkownika zestawu testowego ma zerwane połączenia lub zestaw testowy nie ma profilu użytkownika, pojawia się okno Zarządzanie połączeniami . Nie musisz używać profilu użytkownika do testowania. Jednak jeśli używasz profilu, wszystkie połączenia muszą działać. Aby uzyskać informacje o naprawianiu połączeń, zobacz Zarządzaj profilami użytkowników i połączeniami.

Ocena może zająć kilka minut. W Copilot Studio pojawia się alert, gdy wyniki testów są gotowe do wyświetlenia.

Zanurz się w wyniki testów

Za każdym razem, gdy uruchamiasz ocenę z zestawem testów, Copilot Studio:

  1. Używa połączonego konta użytkownika do symulowania konwersacji z agentem, wysyłając każde pytanie w przypadku testowym do agenta.

  2. Zbiera odpowiedzi agenta.

  3. Mierzy i analizuje skuteczność każdej odpowiedzi. Każdy przypadek testowy otrzymuje wynik Przejście lub Niepowodzenie na podstawie kryteriów przypadku testowego.

  4. Przypisuje ocenę współczynnika zdawalności na podstawie wskaźnika zdanych/niezdanych zestawu testów.

Wskaźnik zdawalności każdego zestawu testów możesz zobaczyć na stronie Ocena twojego agenta, w sekcji Ostatnie wyniki. Wybierz Zobacz wszystko, aby zobaczyć więcej przebiegów zestawu testów.

Zrzut ekranu przedstawiający listę poprzednich ocen.

Zobacz szczegółową analizę przypadku testowego

Po otwarciu wyniku testu możesz zobaczyć szczegóły przeprowadzenia testu, listę zapytań użytych w teście, sposób reakcji agenta oraz wynik Pass or Fail .

Wybierz przypadek testowy z listy, aby zobaczyć szczegółową ocenę każdej odpowiedzi.

Zrzut ekranu przedstawiający listę przypadków testowych w ramach ukończonej oceny.

Ocena obejmuje oczekiwane i rzeczywiste odpowiedzi, uzasadnienie stojące za wynikiem testu oraz wiedzę, tematy i narzędzia, których agent wykorzystał do odpowiedzi.

Wybierz cytowaną wiedzę lub temat, aby go otworzyć.

Zrzut ekranu przedstawiający szczegółowy wynik i ocenę przypadku testowego.

Porównaj wyniki testów

Chcesz przetestować jedną wersję swojego agenta i zobaczyć zmiany w wydajności przed i po wprowadzeniu zmian. Możesz porównać dwa uruchomienia tego samego zestawu testów, korzystając z narzędzia Porównanie z (Comparison with ).

Aby zobaczyć porównanie, musisz uruchomić ten sam zestaw testów co najmniej dwa razy.

  1. Na stronie Ocena Twojego agenta otwórz testowy test, którego chcesz użyć jako bazy do porównania, w sekcji Ostatnie wyniki testów.

  2. Wybierz rozwijane menu Porównaj z testem , a następnie wybierz czas i datę uruchomienia testu, które chcesz porównać z obecnie otwartymi wynikami testu.

Zrzut ekranu pokazujący rozwijane menu Porównaj z rozwinięciem.

Na liście przypadków testowych strzałki pokazują, które wyniki przypadków testowych poprawiły się przez zmianę z niezdanego na zdający , lub spadły przez zmianę z zdanego na niezdający .

Wybierz przypadek testowy, aby zobaczyć więcej szczegółów. W panelu podsumowania Oceny można zobaczyć bezpośrednie porównanie wyników testów, z wynikiem bieżącego testu na górze.

Zrzut ekranu pokazujący porównane wyniki dwóch zestawów testowych.

Eksportowanie wyników testu

Możesz eksportować wyniki testów do pliku CSV. Plik zawiera pytanie, oczekiwaną odpowiedź (jeśli dotyczy), metodę testu, wynik zdawalności (jeśli dotyczy), odpowiedź agenta, wynik testu oraz analizę dla każdego przypadku testowego.

  1. Wejdź na stronę Ocena swojego agenta.
  2. W sekcji Ostatnie wyniki możesz wyeksportować wynik testu, wykonując jedno z następujących działań:
    • Najedź kursorem na przypadek testowy, który chcesz wyeksportować, zaznacz trzy kropki (...), a następnie wybierz Eksport wyników testu.
    • Wybierz przypadek testowy, aby go otworzyć, następnie wybierz trzy kropki (...) w panelu podsumowania oceny , a następnie wybierz Eksport wyników testu.

Wyniki testu pobierają jako nazwa twojego zestawu testowego.csv.