Übung – Auswerten und Vergleichen von AI-Agent-Versionen

30 Minuten

In dieser Übung bewerten Sie zwei Eingabeaufforderungsversionen des Trail Guide Agents und erstellen ein Versionsvergleichsentscheidungsdokument, das angibt, welche Version basierend auf Qualitätsbewertungen und Kostenanalysen für die Produktion gefördert werden soll.

In dieser Übung haben Sie folgende Aufgaben:

Entwerfen von Auswertungsexperimenten mithilfe von Git-Zweigen, um Promptversionen zu verwalten und zu vergleichen.
Manuelle Auswertung von Antworten des KI-Agenten anhand strukturierter Qualitätskriterien (Intent-Auflösung, Relevanz, Fundierung)
Vergleich der Agent-Versionen über Testszenarien hinweg, um Qualitätsunterschiede und Kosteneffekte zu identifizieren

Hinweis

Um diese Übung abzuschließen, benötigen Sie ein Azure-Abonnement, in dem Sie über Administratorzugriff verfügen.

Starten Sie die Übung, und folgen Sie den Anweisungen.

Feedback

War diese Seite hilfreich?