إشعار
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تسجيل الدخول أو تغيير الدلائل.
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تغيير الدلائل.
ينطبق على:
Azure CLI ML extension v2 (current)
Python SDK azure-ai-ml v2 (current)
بعد تدريب نماذج التعلم الآلي أو خطوط الأنابيب، أو إيجاد نماذج مناسبة من كتالوج النماذج، تحتاج إلى نشرها في الإنتاج ليستخدمها الآخرون في الاستنتاج. الاستدلال هو عملية تطبيق بيانات إدخال جديدة على نموذج أو خط أنابيب تعلم آلي لتوليد المخرجات. بينما تسمى هذه المخرجات عادة "تنبؤات"، يمكن للاستدلال أن يولد مخرجات لمهام تعلم آلي أخرى، مثل التصنيف والتجميع. في Azure Machine Learning، تقوم بالاستدلال باستخدام endpoints.
نقاط النهاية والنشر
نقطة النهاية هي رابط URL مستقر ودائم يمكن استخدامه لطلب أو استدعاء نموذج. توفر المدخلات المطلوبة لنقطة النهاية وتستقبل المخرجات. يدعم Azure Machine Learning النشر القياسي، ونقاط النهاية عبر الإنترنت، ونقاط النهاية الدفعية. يوفر الهدف النهائي:
- رابط مستقر ودائم (مثل endpoint-name.region.inference.ml.azure.com)
- آلية مصادقة
- آلية تفويض
النشر هو مجموعة من الموارد والحوسبة المطلوبة لاستضافة النموذج أو المكون الذي يقوم بالاستدلال الفعلي. تحتوي نقطة النهاية على نشر. بالنسبة لنقاط النهاية عبر الإنترنت والدفعات، يمكن أن تحتوي نقطة نهاية واحدة على عدة عمليات نشر. يمكن للعمليات النشر استضافة أصول مستقلة وتستهلك موارد مختلفة بناء على احتياجات الأصول. كما أن نقطة النهاية لديها آلية توجيه يمكنها توجيه الطلبات إلى أي من عمليات نشرها.
بعض أنواع نقاط النهاية في Azure Machine Learning تستهلك موارد مخصصة أثناء نشرها. لكي تعمل هذه النقاط النهائية، يجب أن يكون لديك حصة حساب على اشتراك Azure الخاص بك. ومع ذلك، بعض الطرازات تدعم النشر بدون خادم، مما يسمح لها بعدم استهلاك حصة من اشتراكك. بالنسبة للنشر بدون خادم، يتم احتساب الفوترة بناء على الاستخدام.
الحدس
افترض أنك تعمل على تطبيق يتنبأ بنوع ولون السيارة من خلال صورة. في هذا التطبيق، يقوم المستخدم الذي يمتلك بيانات اعتماد معينة بطلب HTTP إلى رابط URL ويوفر صورة لسيارة كجزء من الطلب. في المقابل، يتلقى المستخدم استجابة تتضمن نوع ولون السيارة كقيم سلاسل نصية. في هذا السيناريو، يعمل الرابط كنقطة نهاية.
الآن افترض أن عالمة بيانات تدعى أليس تقوم بتنفيذ التطبيق. تمتلك أليس خبرة واسعة في TensorFlow وتقرر تنفيذ النموذج باستخدام مصنف تسلسلي Keras مع بنية ResNet من مركز TensorFlow. بعد اختبار النموذج، تشعر أليس بالرضا عن نتائجه وتقرر استخدام النموذج لحل مشكلة توقع السيارة. النموذج كبير ويحتاج إلى 8 جيجابايت من الذاكرة مع 4 أنوية للتشغيل. في هذا السيناريو، تشكل نموذج أليس والموارد—مثل الكود والحوسبة—المطلوبة لتشغيل النموذج نشرا تحت نقطة النهاية.
بعد بضعة أشهر، تكتشف الشركة أن التطبيق يؤدي أداء ضعيفا على الصور ذات ظروف الإضاءة السيئة. بوب، عالم بيانات آخر، لديه خبرة في تقنيات تعزيز البيانات التي تساعد النماذج على بناء متانة لهذا العامل. ومع ذلك، يفضل بوب استخدام PyTorch لتنفيذ النموذج ويدرب نموذجا جديدا باستخدام PyTorch. يريد بوب اختبار هذا النموذج في الإنتاج تدريجيا حتى تصبح المنظمة جاهزة لتقاعد النموذج القديم. النموذج الجديد يؤدي أيضا بشكل أفضل عند نشره على وحدة معالجة الرسومات، لذا يجب أن يتضمن النشر وحدة معالجة رسوميات. في هذا السيناريو، تشكل نموذج بوب والموارد—مثل الكود والحوسبة—المطلوبة لتشغيل النموذج نشرا آخر تحت نفس نقطة النهاية.
نقاط النهاية: النشر القياسي، عبر الإنترنت، والدفعات
يدعم Azure Machine Learning <النشر القياسي c0>formats،
تم تصميم النشر القياسيونقاط النهاية عبر الإنترنت للاستدلال في الوقت الحقيقي. عندما تستدعي نقطة النهاية، تعاد النتائج في استجابة نقطة النهاية. النشرات القياسية لا تستهلك حصة من اشتراكك؛ بدلا من ذلك، يتم احتساب الفواتير بنظام الفوترة القياسي.
تم تصميم نقاط نهاية الدفعات لاستنتاج الدفعات على مدى طويل. عندما تستدعي نقطة نهاية دفعية، فإنك تولد مهمة دفعية تقوم بالعمل الفعلي.
متى تستخدم نقاط النشر القياسية، وعبر الإنترنت، ونقاط النهاية الدفعية
النشر القياسي:
استخدم النشرات القياسية لاستهلاك نماذج أساسية كبيرة للاستنتاج في الوقت الحقيقي جاهزا أو لضبط هذه النماذج. ليست جميع النماذج متاحة للنشر في الإصدارات القياسية. نوصي باستخدام هذا الوضع عندما:
- نموذجك هو نموذج أساسي أو نسخة دقيقة من نموذج أساسي متاح للنشر القياسي.
- يمكنك الاستفادة من نشر بدون حصص.
- لا تحتاج إلى تخصيص مكدس الاستدلال المستخدم لتشغيل النموذج.
نقاط النهاية عبر الإنترنت:
استخدم نقاط النهاية عبر الإنترنت لتشغيل النماذج للاستدلال في الوقت الحقيقي في طلبات التزامن منخفضة التأخير المتزامنة. ننصح باستخدامها عندما:
- نموذجك هو نموذج أساسي أو نسخة مضبوطة بدقة من نموذج أساسي، لكنه غير مدعوم في النشر القياسي.
- لديك متطلبات زمن استجابة منخفضة.
- يمكن لنموذجك الرد على الطلب في وقت قصير نسبيا.
- مدخلات النموذج الخاصة بك تناسب حمولة HTTP الخاصة بالطلب.
- تحتاج إلى زيادة عدد الطلبات.
نقاط نهاية الدفعات:
استخدم نقاط النهاية الدفعية لتشغيل النماذج أو خطوط الأنابيب للحصول على استدلال غير متزامن طويل الأمد. ننصح باستخدامها عندما:
- لديك نماذج أو خطوط أنابيب باهظة الثمن تتطلب وقتا أطول للتشغيل.
- تريد تشغيل خطوط أنابيب التعلم الآلي وإعادة استخدام المكونات.
- تحتاج إلى إجراء استنتاج على كميات كبيرة من البيانات موزعة في ملفات متعددة.
- ليس لديك متطلبات زمن استجابة منخفضة.
- يتم تخزين مدخلات نموذجك في حساب تخزين أو في أصل بيانات Azure Machine Learning.
- يمكنك الاستفادة من التوازي.
مقارنة بين نقاط النشر القياسية، وعبر الإنترنت، ونقاط النهاية الدفعية
جميع النشرات القياسية، ونقاط النهاية عبر الإنترنت، ونقاط النهاية الدفعية تعتمد على فكرة نقاط النهاية، لذلك يمكنك الانتقال بسهولة من واحدة إلى الأخرى. نقاط النهاية عبر الإنترنت والدفعات قادرة أيضا على إدارة عدة عمليات نشر لنفس النقطة.
نقاط النهاية
يوضح الجدول التالي ملخصا للميزات المختلفة المتاحة للنشرات القياسية، ونقاط النهاية عبر الإنترنت، ونقاط النهاية الدفعية على مستوى نقاط النهاية.
| الميزة | النشر القياسي | نقاط النهاية عبر الإنترنت | نقاط نهاية الدفعات |
|---|---|---|---|
| رابط الاستدعاء المستقر | نعم | نعم | نعم |
| دعم النشر المتعدد | لا | نعم | نعم |
| توجيه النشر | لا شيء | تقسيم حركة المرور | التحول إلى الوضع الافتراضي |
| حركة المرور المرآة لنشر آمن | لا | نعم | لا |
| دعم Swagger | نعم | نعم | لا |
| المصادقة | مفتاح | Key و Microsoft Entra ID (معاينة) | Microsoft Entra ID |
| دعم الشبكات الخاصة (القديم) | لا | نعم | نعم |
| عزل الشبكات المدارة | نعم | نعم | نعم (انظر التكوين الإضافي المطلوب) |
| مفاتيح يديرها العميل | NA | نعم | نعم |
| أساس التكلفة | لكل نقطة نهاية، لكل دقيقة1 | لا شيء | لا شيء |
1يتم فرض جزء صغير من الانتشار القياسي في الدقيقة. راجع قسم النشر للرسوم المتعلقة بالاستهلاك، والتي يتم فوترتها لكل رمز.
النشر
يوضح الجدول التالي ملخصا للميزات المختلفة المتاحة للنشرات القياسية، ونقاط النهاية عبر الإنترنت، ونقاط النهاية الدفعية على مستوى النشر. تنطبق هذه المفاهيم على كل نشر تحت نقطة النهاية (لنقاط النهاية عبر الإنترنت والدفعات)، وتنطبق على النشر القياسي (حيث يكون مفهوم النشر مدمجا في نقطة النهاية).
| الميزة | النشر القياسي | نقاط النهاية عبر الإنترنت | نقاط نهاية الدفعات |
|---|---|---|---|
| أنواع النشر | النماذج | النماذج | النماذج ومكونات خط الأنابيب |
| نشر نموذج MLflow | لا، فقط نماذج محددة في الكتالوج | نعم | نعم |
| نشر النماذج المخصصة | لا، فقط نماذج محددة في الكتالوج | نعم، مع نص الموسيقى | نعم، مع نص الموسيقى |
| خادم الاستدلال 2 | Azure AI Model Inference API | - Azure Machine Learning Inferencing Server - ترايتون - مخصص (باستخدام BYOC) |
الاستدلال الدفعي |
| موارد الحوسبة المستهلكة | لا يوجد (بدون خادم) | العينات أو الموارد الدقيقة | مثيلات العنقود |
| نوع الحوسبة | لا يوجد (بدون خادم) | الحوسبة المدارة وKubernetes | الحوسبة المدارة وKubernetes |
| الحوسبة ذات الأولوية المنخفضة | NA | لا | نعم |
| تحويل الحوسبة إلى الصفر | مدمج | لا | نعم |
| الحوسبة ذاتيةالقياس 3 | مدمج | نعم، بناء على استخدام الموارد | نعم، بناء على عدد الوظائف |
| إدارة فائض الطاقة الاستيعابية | التخفيف | التخفيف | الطابور |
| أساس التكلفة4 | لكل رمز | لكل نشر: حساب الحالات التي تعمل | لكل وظيفة: يحسب العينات المستهلكة في المهمة (بحد أقصى لعدد نسخ العنقود) |
| الاختبار المحلي للنشرات | لا | نعم | لا |
2يشير خادم الاستدلال إلى تقنية التقديم التي تأخذ الطلبات، تعالجها، وتنشئ الردود. كما يحدد خادم الاستدلال تنسيق الإدخال والمخرجات المتوقعة.
3التدرج التلقائي هو القدرة على توسيع أو تقليل الموارد المخصصة للنشر بشكل ديناميكي بناء على حمله. تستخدم النشر عبر الإنترنت والمجموعات استراتيجيات مختلفة للتدرج التلقائي. بينما تتوسع عمليات النشر عبر الإنترنت صعودا أو تقليلا بناء على استهلاك الموارد (مثل المعالج، الذاكرة، الطلبات، إلخ)، فإن نقاط النهاية الدفعية تتدرج أو تخفض بناء على عدد المهام التي تم إنشاؤها.
4 كل من النشر عبر الإنترنت والدفعات يفرض رسوما حسب الموارد المستهلكة. في النشر عبر الإنترنت، يتم توفير الموارد في وقت النشر. في عمليات النشر الدفعية، لا تستهلك الموارد في وقت النشر بل في الوقت الذي تعمل فيه المهمة. لذا، لا توجد تكلفة مرتبطة بنشر الدفعة نفسه. وبالمثل، الوظائف المنتظرة لا تستهلك الموارد أيضا.
واجهات المطورين
تم تصميم نقاط النهاية لمساعدة المؤسسات على تشغيل أعباء العمل على مستوى الإنتاج في Azure Machine Learning. نقاط النهاية موارد قوية وقابلة للتوسع، وتوفر أفضل القدرات لتنفيذ سير عمل MLOps.
يمكنك إنشاء وإدارة نقاط نهاية دفعية وعبر الإنترنت باستخدام عدة أدوات للمطورين:
- Azure CLI و Python SDK
- Azure Resource Manager/REST API
- Azure Machine Learning Studio web portal
- بوابة Azure (تقنية المعلومات/المسؤول)
- دعم خطوط أنابيب CI/CD MLOps باستخدام واجهة Azure CLI و واجهات REST/ARM