تقييم نماذج اللغة باستخدام Azure Databricks

متوسط
مهندس بيانات
Azure Databricks

في هذه الوحدة، يمكنك استكشاف تقييم نموذج اللغة الكبيرة باستخدام مقاييس ونهج مختلفة، والتعرف على تحديات التقييم وأفضل الممارسات، واكتشاف تقنيات التقييم التلقائية بما في ذلك أساليب LLM-as-a-judge.

الأهداف التعليمية

في هذه الوحدة النمطية، تتعلم كيفية:

  • تقييم نماذج تقييم LLM
  • وصف العلاقة بين تقييم LLM وتقييم نظام الذكاء الاصطناعي
  • وصف مقاييس تقييم LLM القياسية مثل الدقة والحيرة والسمية
  • وصف LLM كقاض للتقييم

المتطلبات الأساسية

قبل بدء هذه الوحدة النمطية، يجب أن تكون على دراية ب Azure Databricks. ضع في اعتبارك إكمال استكشاف Azure Databricks قبل بدء هذه الوحدة النمطية.