مقدمة
دورة حياة تطوير الذكاء الاصطناعي التوليدي هي تكرارية، والتقييم هو آلية التغذية الراجعة التي تخبرك ما إذا كان التغيير قد حسن النظام فعليا. تساعدك ممارسات التقييم القوية على قياس جودة الاستجابة، جودة الاسترجاع، السلامة، والموثوقية قبل إصدار ميزة وبعد تغيير التعليمات أو البيانات أو النماذج.
توضح الصورة "دورة حياة تطوير الذكاء الاصطناعي الإنشاء" مع رسم تخطيطي على نمط المخطط الانسيابي. يتم تعيين الرسم التخطيطي على خلفية فاتحة ويستخدم نظام ألوان أزرق وأبيض بألوان تمييز للأيقونات. تبدأ دورة الحياة ب "تعريف حالة الاستخدام الخاصة بك" على اليسار، ما يؤدي إلى مستطيل كبير مستدير الزوايا يحتوي على المراحل الرئيسية للعملية. ضمن هذا المجال الرئيسي، هناك خمسة مكونات رئيسية مرتبة أفقيا: الخريطة، والقياس، والتخفيف، والتشغيل، والتحكم. يشير التخطيط إلى تدفق تسلسلي من Map إلى Operate، مع التحكم في جميع المراحل. يشكل السهم الكبير حلقة حول العملية بأكملها، بدءا من "تعريف حالة الاستخدام الخاصة بك"، والانتقال باتجاه عقارب الساعة عبر جميع المراحل، ثم العودة إلى البداية. يشير هذا إلى دورة حياة متكررة مستمرة لتطوير الذكاء الاصطناعي.
بينما كل خطوة في العملية ضرورية لبناء حلول ذكاء اصطناعي توليدي موثوقة، فإن مرحلة القياس هي حيث تتحقق الفرق من أن التطبيق يتصرف كما هو مقصود. توفر Microsoft Foundry قدرات التقييم وتحليل النتائج والملاحظة التي تساعدك على تقييم النماذج، وأنظمة التوليد المعزز بالاسترجاع (RAG)، والوكلاء بطريقة قابلة للتكرار. تقدم هذه الوحدة المفاهيم الأساسية لاختيار بيانات التقييم، واختيار المقيمين، وتفسير النتائج.
أهداف التعلم
من خلال إكمال هذه الوحدة النمطية، يمكنك:
- تطبيق أفضل الممارسات لاختيار بيانات التقييم
- اشرح متى تستخدم البيانات الواقعية، والتركيبية، والبيانات العدائية
- صف نطاق المقيمين المدمجين
- اختر مقيمين يناسبون حالتك
- تفسير نتائج التقييم واستخدامها لتوجيه التخفيفات
المتطلبات المسبقه
- اشتراك Azure - أنشئ واحدا مجانا
- التعرف على Azure ومدخل Azure