Wissensüberprüfung

5 Minuten

Was ist der Hauptgrund für die Organisation von Agent-Optimierungsexperimenten in separaten Git-Branches?

So aktivieren Sie parallele Entwicklung durch mehrere Teammitglieder gleichzeitig

Um spezifische Änderungen zu isolieren und Leistungsunterschiede einzelnen Modifikationen zuzuordnen

Einhaltung gesetzlicher Vorschriften für die Versionssteuerung

Adventure Works wertet ihren Trail Guide Agent mithilfe von Intent Resolution-Bewertungen aus. Drei Evaluatoren bewerten die gleiche Antwort wie 5, 3 und 2. Was bedeutet dies?

Die Reaktionsqualität ist inkonsistent und erfordert Verbesserungen

Die Bewertungsrubrik enthält nicht genug Details, und die Bewerter benötigen Kalibrierungstraining.

Die durchschnittliche Bewertung von 3,3 gibt an, dass die Antwort den Mindestqualitätsschwellenwert erfüllt.

Ihr Experiment zeigt, dass GPT-4 mini die Kosten um 75% reduziert und gleichzeitig eine durchschnittliche Qualitätsbewertung von 4,1 (Schwellenwert: 4,2) und die Reaktionszeit von 32 bis 18 Sekunden verbessert. Was sollten Sie tun?

Sofortige Bereitstellung von GPT-4 mini für die Produktion, da sie zwei von drei Erfolgskriterien erfüllt

Dokumentieren Sie die Trade-Offs und suchen Sie nach Eingaben der Unternehmensbeteiligten, ob Kosteneinsparungen die Qualitätsreduzierung rechtfertigen

GPT-4 Mini ablehnen und gpT-4 ohne weitere Tests weiterhin verwenden

Sie müssen alle Fragen beantworten, bevor Sie Ihre Arbeit überprüfen können.

Feedback

War diese Seite hilfreich?

Wissensüberprüfung

Überprüfen Sie Ihr Wissen

Feedback