Opret eller modificere et testsæt for at evaluere din agent

[Denne artikel er til dokumentationen til den foreløbige udgivelse. Der kan forekomme ændringer.]

Et testsæt består af en gruppe på op til 100 testtilfælde. Når du kører en agentvurdering, vælger du et testsæt, og Copilot Studio kører alle testcases i det sæt mod din agent.

Du kan manuelt oprette testcases inden for et testsæt, importere dem ved hjælp af et regneark eller bruge AI til at generere beskeder baseret på din agents design og ressourcer. Du kan derefter vælge, hvordan du vil måle kvaliteten af din agents svar for hver testcase i et testsæt.

For mere information om, hvordan agentvurdering fungerer, se Om agentvurdering.

For at lære, hvordan man redigerer et eksisterende testsæt, se Ændr detaljerne i et testsæt.

Vigtigt!

Testresultater er tilgængelige i Copilot Studio i 89 dage. For at gemme dine testresultater i længere tid, eksporter resultaterne til en CSV-fil.

Opret et nyt testsæt

Gå til din agents vurderingsside .

Vælg Ny evaluering.
På siden Ny evaluering vælger du den metode, du vil bruge til at oprette dit testsæt. Et testsæt kan have op til 100 testcases.
- Sæt et hurtigt spørgsmål for at få Copilot Studio til automatisk at oprette testcases baseret på din agents beskrivelse, instruktioner og kapaciteter. Denne mulighed genererer 10 spørgsmål til at køre små, hurtige evalueringer eller til at begynde at opbygge et større testsæt.
- Et komplet spørgsmålssæt for at lade Copilot Studio generere testcases ved hjælp af din agents videnskilder eller emner og vælge antallet af spørgsmål, der skal genereres.
- Brug din testchat-samtale til automatisk at udfylde testsættet med de spørgsmål, du har givet i din testchat. Denne metode bruger spørgsmål fra den seneste testchat. Du kan også starte en evaluering fra testchatten ved at bruge evaluer-knappen .
- Importer testcases fra en fil ved at trække din fil ind i det udpegede område, vælge Gennemse for at uploade en fil eller vælge en af de andre uploadmuligheder.
- Eller skriv selv nogle spørgsmål for manuelt at lave et testsæt. Følg trinene for at redigere et testsæt for at tilføje og redigere testcases.
- Brug produktionsdata baseret på temaer fra din agents analyser.
Rediger detaljerne i testtilfældene. Alle testcases, der bruger metoder, undtagen generel kvalitet, kræver forventede svar. For mere information om redigering, se Ændr et testsæt.
Angiv et navn til testsættet under Navn.

Ændr eller tilføj de testmetoder , du ønsker at bruge:

Tilføj en ny metode:
1. Vælg Tilføj testmetode.
2. Vælg alle de metoder, du vil teste med, og vælg derefter OK. Du kan tilføje flere metoder.
3. For nogle metoder skal du sætte en bestået score, og derefter vælge OK. Beståelsesscoren bestemmer, hvilken score der resulterer i bestået eller dumpet.
4. Nogle metoder kræver, at man tilføjer forventede svar eller nøgleord for hvert af dine testtilfælde. For mere information, se Vælg evalueringsmetoder.
Vælg en eksisterende testmetode til redigering eller sletning.

Testmetode	Målinger	Scoring	Konfigurationer
Generel kvalitet	Hvor godt er testcases svar baseret på specifikke kvaliteter	Scoret ud af 100%	None
Sammenlign betydning	Hvor godt betydningen af testtilfældets svar matcher det forventede svar	Scoret ud af 100%	Bestået score, forventet svar
Kapacitetsanvendelse	Om testsagen brugte de forventede ressourcer	Bestået/ikke bestået	Forventede kapaciteter
Nøgleordsmatch	Om testsagen brugte alle eller nogle af de forventede nøgleord eller fraser	Bestået/ikke bestået	Forventede nøgleord eller fraser
Tekstlighed	Hvor godt teksten i testtilfældets svar matcher det forventede svar	Scoret ud af 100%	Bestået score, forventet svar
Præcist match	Om testtilfældets svar præcist matcher det forventede svar	Bestået/ikke bestået	Forventet svar

Vælg brugerprofil, og vælg eller tilføj derefter den konto, du vil bruge til dette testsæt, eller fortsæt uden autentificering. Evalueringen bruger denne konto til at forbinde til videnskilder og værktøjer under testning. For information om at tilføje og administrere brugerprofiler, se Administrer brugerprofiler og forbindelser.

Notat

Automatiseret test bruger autentificeringen af den valgte testkonto. Hvis din agent har videnskilder eller forbindelser, der kræver specifik autentificering, vælg den relevante konto til din testning. Når Copilot Studio genererer testcases, bruger den autentificeringsoplysningerne fra en tilknyttet konto til at få adgang til din agents videnskilder og værktøjer. De genererede testcases eller resultater kan indeholde følsomme oplysninger, som den tilknyttede konto har adgang til, og disse oplysninger er synlige for alle skabere, der kan få adgang til testsættet.
Vælg Save for at opdatere testsættet uden at køre testcases eller Evaluate for at køre testsættet med det samme.

Begrænsning for generering af testtilfælde

Generering af testcases fejler, hvis et eller flere spørgsmål overtræder din agents indholdsmoderationsindstillinger. Mulige årsager inkluderer:

Agentens instruktioner eller emner fører modellen til at generere indhold, som systemet markerer.
Den tilknyttede videnskilde indeholder følsomt eller begrænset indhold.
Agentens indholdsmoderationsindstillinger er alt for strenge.

For at løse problemet kan du prøve forskellige handlinger, såsom at justere videnskilder, opdatere instruktioner eller ændre moderationsindstillinger.

Et testsæt kan indeholde op til 100 testtilfælde.

Generer et testsæt ud fra viden eller emner

Du kan teste din agent ved at generere spørgsmål ved hjælp af de oplysninger og samtalekilder, din agent allerede har. Denne testmetode er god til at teste, hvordan din agent bruger den viden og de emner, den allerede har, men den er ikke god til at teste for informationshuller.

Du kan generere testcases ved at bruge disse videnskilder:

Tekst
Microsoft Word
Microsoft Excel

Du kan bruge filer på op til 293 KB til at generere testspørgsmål.

For at generere et testsæt:

I Ny evaluering skal du vælge Hele spørgsmålssættet.
Vælg enten Viden eller Emner.
- Viden fungerer bedst for agenter, der bruger generativ orkestrering. Denne metode skaber spørgsmål ved at bruge et udvalg af din agents videnskilder.
- Topics fungerer bedst for agenter, der bruger klassisk orkestrering. Denne metode skaber spørgsmål ved at bruge din agents emner.
For Knowledge skal du vælge de videnskilder, du vil inkludere i spørgsmålsgenereringen.

Skærmbillede, der viser udvælgelsen af videnskilder, der skal inkluderes i testcase-genereringen.

For Viden og emner skal du vælge og trække skyderen for at vælge, hvor mange spørgsmål der skal genereres.

Skærmbillede, der viser skyderen til at vælge, hvor mange spørgsmål der skal genereres.

Vælg Generer.
Angiv et navn til testsættet under Navn.
1. Ændr eller tilføj de testmetoder , du ønsker at bruge:
- Tilføj en ny metode:
  1. Vælg Tilføj testmetode.
  2. Vælg alle de metoder, du vil teste med, og vælg derefter OK. Du kan tilføje flere metoder.
  3. For nogle metoder skal du sætte en bestået score, og derefter vælge OK. Beståelsesscoren bestemmer, hvilken score der resulterer i bestået eller dumpet.
  4. Nogle metoder kræver, at man tilføjer forventede svar eller nøgleord for hvert af dine testtilfælde. For mere information, se Vælg evalueringsmetoder
- Vælg en eksisterende testmetode til redigering eller sletning.
Rediger detaljerne i testtilfældene. Alle testcases, der bruger metoder, undtagen generel kvalitet, kræver forventede svar. For mere information om redigering, se Ændr et testsæt.
Vælg Save for at opdatere testsættet uden at køre testcases eller Evaluate for at køre testsættet med det samme.

Opret en testsætfil til import

I stedet for at bygge dine testcases direkte i Copilot Studio kan du oprette en regnearksfil med alle dine testcases og importere dem for at oprette dit testsæt. Du kan skrive hvert testspørgsmål, bestemme den testmetode, du vil bruge, og angive de forventede svar for hvert spørgsmål. Når du er færdig med at oprette filen, skal du gemme den som en .csv- eller .txt-fil og importere den i Copilot Studio.

Vigtigt!

Filen kan indeholde op til 100 spørgsmål.
Hvert spørgsmål kan være op til 1.000 tegn, herunder mellemrum.
Filen skal være i CSV-format (kommaseparerede værdier) eller tekstformat.

Sådan oprettes importfilen:

Åbn et regnearksprogram (f.eks. Microsoft Excel).
Tilføj følgende overskrifter i denne rækkefølge i den første række:
- Spørgsmål
- Forventet svar
- Testmetode
Angiv dine testspørgsmål i kolonnen Spørgsmål. Hvert spørgsmål kan være på 1.000 tegn eller mindre, inklusive mellemrum.
Indtast en af følgende testmetoder for hvert spørgsmål i kolonnen Testmetode :
- Generel kvalitet
- Sammenlign betydning
- Lighed
- Nøjagtigt match
- Nøgleordsmatch
Angiv de forventede svar for hvert spørgsmål i kolonnen Forventet svar. Forventede svar er valgfrie for import af et testsæt. Du skal dog have forventede svar for at køre match, lighed og sammenligne betydningstestcases.
Gem filen som en .csv- eller .txt-fil.
Importer filen ved at følge trinene i Opret et nyt testsæt.

Lav et testsæt baseret på et tema

Lav et testsæt med spørgsmål fra samtaler med rigtige brugere. Denne metode bruger temaer (forhåndsvisning), som findes i din agents analyser.

Temaer er grupperinger af spørgsmål, der er taget fra gruppen af brugerspørgsmål, der udløser generative svar. Når du opretter et testsæt med et tema, genererer du testcases ud fra spørgsmål stillet af brugere relateret til det tema.

Brug disse testsæt til at udføre evalueringer med fokus på ét område eller emne inden for din agents omfang. For eksempel, hvis du har en kundeservicemedarbejder, kan du spore svarkvaliteten på fakturerings- og betalingsspørgsmål separat fra andre anvendelsestilfælde som fejlfinding.

Notat

Før du opretter testsæt ud fra temaer, har du brug for adgang til temaer i analytics. Gennemgå adgangskravene til temaer (forhåndsvisning).

På din agents Analytics-side skal du gå til listen over temaer .
Hold musen over et tema, og vælg derefter Evaluer.

Du kan også vælge Se alle for at se flere temaer og derefter vælge Evaluer.
Vælg Opret og åbn.
Rediger detaljerne om testsættene og sagerne. Alle testcases, der bruger metoder, undtagen generel kvalitet, kræver forventede svar. For mere information om redigering, se Ændr et testsæt.
Vælg Save for at opdatere testsættet uden at køre testcases eller Evaluate for at køre testsættet med det samme.

Feedback

Var denne side nyttig?

Last updated on 2026-02-10