Dieser Browser wird nicht mehr unterstützt.
Führen Sie ein Upgrade auf Microsoft Edge durch, um die neuesten Features, Sicherheitsupdates und den technischen Support zu nutzen.
Was ist der Hauptgrund für die Organisation von Agent-Optimierungsexperimenten in separaten Git-Branches?
So aktivieren Sie parallele Entwicklung durch mehrere Teammitglieder gleichzeitig
Um spezifische Änderungen zu isolieren und Leistungsunterschiede einzelnen Modifikationen zuzuordnen
Einhaltung gesetzlicher Vorschriften für die Versionssteuerung
Adventure Works wertet ihren Trail Guide Agent mithilfe von Intent Resolution-Bewertungen aus. Drei Evaluatoren bewerten die gleiche Antwort wie 5, 3 und 2. Was bedeutet dies?
Die Reaktionsqualität ist inkonsistent und erfordert Verbesserungen
Die Bewertungsrubrik enthält nicht genug Details, und die Bewerter benötigen Kalibrierungstraining.
Die durchschnittliche Bewertung von 3,3 gibt an, dass die Antwort den Mindestqualitätsschwellenwert erfüllt.
Ihr Experiment zeigt, dass GPT-4 mini die Kosten um 75% reduziert und gleichzeitig eine durchschnittliche Qualitätsbewertung von 4,1 (Schwellenwert: 4,2) und die Reaktionszeit von 32 bis 18 Sekunden verbessert. Was sollten Sie tun?
Sofortige Bereitstellung von GPT-4 mini für die Produktion, da sie zwei von drei Erfolgskriterien erfüllt
Dokumentieren Sie die Trade-Offs und suchen Sie nach Eingaben der Unternehmensbeteiligten, ob Kosteneinsparungen die Qualitätsreduzierung rechtfertigen
GPT-4 Mini ablehnen und gpT-4 ohne weitere Tests weiterhin verwenden
Sie müssen alle Fragen beantworten, bevor Sie Ihre Arbeit überprüfen können.
War diese Seite hilfreich?
Benötigen Sie Hilfe zu diesem Thema?
Möchten Sie versuchen, Ask Learn zu verwenden, um Sie durch dieses Thema zu klären oder zu leiten?