Aflevering

Geautomatiseerde evaluatie van LLM-apps met de azure-ai-generatieve SDK | Python Datawetenschap Day

wordt uitgevoerd met Pamela Fox

Geautomatiseerde evaluatie van LLM-apps met azure ai-generatieve SDK.

Hoofdstukken

  • 00:00 - Geautomatiseerde evaluatie van LLM-apps met de azure-ai-generatieve SDK
  • 00:55 - Typen LLM-apps
  • 01:09 - Alleen-vragen LLM-app
  • 03:14 - Augmented Generation (RAG) LLM-app ophalen
  • 07:05 - RAG-stroom
  • 08:10 - Zijn de antwoorden van hoge kwaliteit?
  • 11:21 - LLM Ops voor LLM-apps
  • 12:46 - Experimenteren met kwaliteitsfactoren
  • 14:55 - AI RAG Chat Evaluator https://aka.ms/rag/eval
  • 16:07 - Grond waarheidsgegevens
  • 18:32 - Evaluatie
  • 25:29 - Evaluatiebenadering
  • 25:57 - Gegevenssets voor grondwaar verbeteren
  • 26:17 - Volgende stappen

Verbinden

Developer
Python