مشاركة عبر


نشر نموذج دقيق للاستدلال

بمجرد ضبط النموذج الخاص بك، يمكنك نشر النموذج واستخدامه في التطبيق الخاص بك.

عند نشر النموذج، فإنك تجعل النموذج متاحا للاستدلال، وهذا يتطلب رسوم استضافة كل ساعة. ومع ذلك، يمكن تخزين النماذج الدقيقة في Azure الذكاء الاصطناعي Foundry دون أي تكلفة حتى تصبح جاهزا لاستخدامها.

يوفر Azure OpenAI اختيارات أنواع النشر للنماذج الدقيقة على بنية الاستضافة التي تناسب أنماط العمل والاستخدام المختلفة: قياسي، معيار عالمي (معاينة) ومعدل النقل المقدم (معاينة). تعرف على المزيد حول أنواع التوزيع للنماذج الدقيقةومفاهيم جميع أنواع التوزيع.

توزيع النموذج الذي تم ضبطه بدقة

لنشر النموذج المخصص، حدد النموذج المخصص الذي تريد نشره، ثم حدد Deploy.

يتم فتح مربع الحوار Deploy model . في مربع الحوار، أدخل اسم النشر ثم حدد إنشاء لبدء نشر النموذج المخصص.

لقطة شاشة توضح كيفية نشر نموذج مخصص في مدخل Azure الذكاء الاصطناعي Foundry.

يمكنك مراقبة تقدم النشر الخاص بك في جزء Deployments في مدخل Azure الذكاء الاصطناعي Foundry.

لا تدعم واجهة المستخدم التوزيع عبر المناطق، بينما تدعم Python SDK أو REST.

هام

بعد نشر نموذج مخصص، إذا ظل النشر غير نشط في أي وقت لأكثر من خمسة عشر (15) يوما، يتم حذف النشر. يعد نشر نموذج مخصص غير نشط إذا تم نشر النموذج منذ أكثر من خمسة عشر (15) يوما ولم يتم إجراء أي مكالمات إكمال أو إكمال دردشة إليه خلال فترة 15 يوما مستمرة.

لا يؤدي حذف التوزيع غير النشط إلى حذف النموذج المخصص الأساسي أو التأثير عليه، ويمكن إعادة نشر النموذج المخصص في أي وقت. كما هو موضح في Azure OpenAI في تسعير Azure الذكاء الاصطناعي Foundry Models، فإن كل نموذج مخصص (مضبوط) يتم توزيعه يتحمل تكلفة استضافة كل ساعة بغض النظر عما إذا كان يتم إجراء عمليات إكمال أو مكالمات إكمال الدردشة إلى النموذج. لمعرفة المزيد حول تخطيط التكاليف وإدارتها باستخدام Azure OpenAI، راجع الإرشادات الواردة في خطة لإدارة تكاليف Azure OpenAI.

استخدام النموذج الذي تم توزيعه بدقة

بعد نشر النموذج المخصص الخاص بك، يمكنك استخدامه مثل أي نموذج آخر تم نشره. يمكنك استخدام Playgrounds في مدخل Azure الذكاء الاصطناعي Foundry لتجربة التوزيع الجديد. يمكنك الاستمرار في استخدام نفس المعلمات مع النموذج المخصص الخاص بك، مثل temperature و max_tokens، كما يمكنك مع النماذج الأخرى المنشورة.

لقطة شاشة لجزء Playground في مدخل Azure الذكاء الاصطناعي Foundry، مع تمييز الأقسام.

التخزين المؤقت للمطالبة

يدعم ضبط Azure OpenAI الدقيق التخزين المؤقت للمطالبة مع نماذج محددة. يسمح لك التخزين المؤقت للمطالبة بتقليل زمن انتقال الطلب الإجمالي والتكلفة للمطالبات الأطول التي تحتوي على محتوى متطابق في بداية المطالبة. لمعرفة المزيد حول التخزين المؤقت للمطالبة، راجع البدء في التخزين المؤقت للمطالبة.

أنواع التوزيع

يدعم ضبط Azure OpenAI أنواع التوزيع التالية.

قياسي

توفر عمليات النشر القياسية نموذج فوترة الدفع لكل مكالمة، وقد يكون النموذج المتاح في كل منطقة وكذلك معدل النقل محدودا.

نماذج المنطقة
GPT-4o-finetune شرق الولايات المتحدة 2، شمال وسط الولايات المتحدة، السويد الوسطى
gpt-4o-mini-2024-07-18 شمال وسط الولايات المتحدة، السويد الوسطى
GPT-4-finetune شمال وسط الولايات المتحدة، السويد الوسطى
GPT-35-Turbo-finetune شرق الولايات المتحدة 2، شمال وسط الولايات المتحدة، وسط السويد، غرب سويسرا
GPT-35-Turbo-1106-finetune شرق الولايات المتحدة 2، شمال وسط الولايات المتحدة، وسط السويد، غرب سويسرا
GPT-35-Turbo-0125-finetune شرق الولايات المتحدة 2، شمال وسط الولايات المتحدة، وسط السويد، غرب سويسرا

معيار عالمي

توفر عمليات النشر العالمية المضبطة القياسيةتوفيرا في التكاليف، ولكن قد يتم تخزين أوزان النموذج المخصص مؤقتا خارج جغرافية مورد Azure OpenAI.

نماذج المنطقة
GPT-4.1-finetune شرق الولايات المتحدة 2 وشمال وسط الولايات المتحدة ووسط السويد
GPT-4.1-mini-finetune شرق الولايات المتحدة 2 وشمال وسط الولايات المتحدة ووسط السويد
GPT-4.1-nano-finetune شرق الولايات المتحدة 2 وشمال وسط الولايات المتحدة ووسط السويد
GPT-4o-finetune شرق الولايات المتحدة 2 وشمال وسط الولايات المتحدة ووسط السويد
GPT-4o-mini-finetune شرق الولايات المتحدة 2 وشمال وسط الولايات المتحدة ووسط السويد

لقطة شاشة لتجربة مستخدم التوزيع القياسي العالمي مع نموذج دقيق.

معدل النقل المتوفر

نماذج المنطقة
GPT-4o-finetune شمال وسط الولايات المتحدة، السويد الوسطى
GPT-4o-mini-finetune شمال وسط الولايات المتحدة، السويد الوسطى

توفر عمليات التوزيع الدقيقة لمعدل النقل المقدمأداء يمكن التنبؤ به للعوامل والتطبيقات الحساسة لزمن الانتقال. يستخدمون نفس سعة الإنتاجية الإقليمية المتوفرة (PTU) مثل النماذج الأساسية، لذلك إذا كان لديك بالفعل حصة PTU إقليمية، يمكنك نشر نموذجك المضبط بدقة في مناطق الدعم.

تنظيف التوزيع الخاص بك

لحذف عملية نشر، استخدم Deployments - Delete REST API وأرسل HTTP DELETE إلى مورد التوزيع. كما هو الحال مع إنشاء عمليات النشر، يجب تضمين المعلمات التالية:

  • مُعرف اشتراكك في Azure
  • اسم مجموعة موارد Azure
  • اسم مورد Azure OpenAI
  • اسم النشر المراد حذفه

فيما يلي مثال واجهة برمجة تطبيقات REST لحذف عملية نشر:

curl -X DELETE "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>api-version=2024-10-21" \
  -H "Authorization: Bearer <TOKEN>"

يمكنك أيضا حذف نشر في مدخل Azure الذكاء الاصطناعي Foundry، أو استخدام Azure CLI.

الخطوات التالية