إشعار
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تسجيل الدخول أو تغيير الدلائل.
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تغيير الدلائل.
نماذج Microsoft Foundry هي المركز لاكتشاف ونشر مجموعة واسعة من نماذج الذكاء الاصطناعي لتطبيقات الذكاء الاصطناعي التوليدي. لجعل نموذج متاحا لطلبات الاستنتاج، تقوم بنشره. يقدم Foundry خيارين للنشر حسب نوع الطراز واحتياجاتك من البنية التحتية.
نصيحة
ليس عليك دائما إنشاء نشر. مع النماذج الفورية (المعاينة)، تستدعي النماذج المدعومة بالاسم وتبدأ في تشغيل الاستدلال فورا — دون الحاجة إلى نشر.
خيارات النشر
يوفر فاوندري خيارين للنشر:
- النشر القياسي في موارد Foundry — لنماذج Foundry، بما في ذلك Foundry Models التي تباعها Azure (المعروفة أيضا باسم Azure Direct Models أو ADM) وselect Models من الشركاء والمجتمع. هذا الخيار هو المسار المفضل والأكثر قدرة.
- نشر الحوسبة المدارة (المعاينة) — متاح لجميع نماذج البرمجيات مفتوحة المصدر (OSS)، بما في ذلك نماذج الشركاء والمجتمع، والنماذج المخصصة.
بوابة Foundry تختار تلقائيا خيار النشر المناسب بناء على النموذج الذي تختاره.
| النشر القياسي في موارد Foundry | الحوسبة المدارة | |
|---|---|---|
| النماذج | ADM models (Azure نماذج OpenAI + الشريكة التي يتم فوترتها عبر Azure) واختيار Models من الشركاء والمجتمع | نماذج أخرى في كتالوج النماذج من الشركاء والنماذج المخصصة. على سبيل المثال، نماذج من Hugging Face وNVIDIA NIMs ونماذج الصناعة وDatabricks. |
| التصنيف | استخدام الرموز أو وحدات النقل المخصصة (PTU) | كل ساعة لكل وحدة تخزين مسرع |
| معالجة البيانات | إقليمي، منطقة بيانات، أو عالمي | إقليمي فقط |
| تصفية المحتوى | مدمج وقابل للتخصيص | عبر واجهات برمجة التطبيقات أمان محتوى الذكاء الاصطناعي في Azure |
النشر القياسي في موارد Foundry
النشر القياسي في موارد Foundry هو الخيار المفضل للنشر في Foundry. يدعم أوسع مجموعة من القدرات وأنواع النشر.
أي الطرازات تستخدم النشر القياسي؟
جميع نماذج المسبك، بما في ذلك <نماذج الصب c0>Foundry التي تباعها Azure ونماذج
القدرات
النشر القياسي يدعم:
- أنواع نشر متعددة — المعيار العالمي، معيار منطقة البيانات، المعيار الإقليمي، التوفير المستمر، الدفعات، والمزيد. كل نوع يتحكم في مكان معالجة البيانات وكيفية الدفع. للتفاصيل، راجع أنواع النشر لنماذج Microsoft Foundry.
- مرونة معالجة البيانات — اختر المعالجة الإقليمية، منطقة البيانات (الولايات المتحدة أو الاتحاد الأوروبي)، أو المعالجة العالمية بناء على متطلبات الامتثال الخاصة بك.
- Content filtering — فلاتر أمان محتوى الذكاء الاصطناعي في Azure مدمجة مع تكوينات قابلة للتخصيص.
- المصادقة بدون مفتاح — Microsoft Entra ID (موصى به) والمصادقة القائمة على المفاتيح.
- الشبكات الخاصة — تكامل الشبكة الافتراضية للوصول الآمن.
- معدل النقل المقدم — سعة احتياطية مع وحدات PTU لأداء متوقع منخفض التأخير. للتفاصيل، انظر معدل النقل المخصص.
متطلبات الموارد
النشر القياسي متاح في:
- موارد Foundry — النوع الأساسي من الموارد لمشاريع Foundry الجديدة. لا حاجة إلى مركز ذكاء اصطناعي.
- Azure موارد OpenAI — إذا استخدمت موارد Azure OpenAI، فإن كتالوج النماذج يعرض فقط Azure نماذج OpenAI للنشر. قم بالترقية إلى مورد في Foundry للوصول إلى مجموعة نماذج Foundry الكاملة.
للبدء في النشر، راجع نشر نماذج Microsoft Foundry في بوابة Foundry أو Deploy models باستخدام Azure CLI و Bicep.
نشر الحوسبة المدارة (المعاينة)
ملحوظة
الحساب المدار في Foundry حاليا في المعاينة العامة والتسجيل مطلوب لاستخدامه. يتم توفير هذا العرض التمهيدي دون اتفاقية على مستوى الخدمة، ولا نوصي به لأعباء العمل الإنتاجية. قد لا تكون بعض الميزات مدعومة أو قد تكون ذات قدرات محدودة. لمزيد من المعلومات، راجع شروط الاستخدام الإضافية لمعاينات Microsoft Azure.
الحوسبة المدارة في Foundry (المعاينة) هي منصة معالجة رسومات مدارة كخدمة (PaaS) تستضيف نماذج مفتوحة المصدر وذات وزن مخصص على سعة مخصصة لوحدة معالجة الرسوميات. يمكنك الوصول إلى عمليات نشر الحوسبة المدارة من خلال نفس نقطة نهاية مشروع Foundry مثل أنواع النشر الأخرى، دون الحاجة إلى آلات افتراضية أو عناقيد أو أوقات تشغيل خدمة لامتلاكها. يقوم Foundry بقياس حجم النشر، وتوفير المسرعات، ويحافظ على وقت التشغيل معدلا.
مهم
تدعم الحوسبة المدارة نماذج مفتوحة المصدر، ونماذج شركاء، وصناعية، ونماذج مخصصة. يتم تقديم عمليات نشر الحوسبة المدارة على نقطة نهاية مشروع Foundry الموحدة، باستخدام نفس المصادقة والشبكة وسطح SDK.
أي النماذج تستخدم الحوسبة المدارة؟
أمثلة على مجموعات النماذج التي تتطلب حوسبة مدارة تشمل:
- وجه العناق
- بعض نماذج الميتا
- بعض نماذج ميسترال
- خدمات الاستدلال الدقيقة NVIDIA (NIMs)
- نماذج الصناعة (Saifr، Rockwell، Bayer، Cerence، Sight Machine، Page AI، SDAIA)
- Databricks
- نماذج مخصصة
يتضمن كتالوج Microsoft Foundry 10,000+ نموذج مفتوح المصدر ونموذج شريك، مع حوالي 50 نموذجا جديدا يتم نشره شهريا.
القدرات
يدعم الحوسبة المدارة (المعاينة):
-
Unified Foundry ونقطة النهاية والمصادقة — استخدم نفس نقطة نهاية المشروع، ومفاتيح API، و Microsoft Entra ID، والشبكات الخاصة كعمليات دفع لكل رمز وعمليات نقل متوفرة. تستخدم
<endpoint>/managed-deployments/<deployment-name>/مسارات الاستدلال . تعمل أوقات التشغيل المتوافقة مع إكمال الدردشة أيضا على المسار القياسي/openai/v1/مع حزمة تطوير البرمجيات OpenAI. - حجم النماذج على النسخة — يتم حجم عمليات النشر بمصطلحات تركز على النموذج. لا تحتاج إلى اختيار وحدات SKU للآلة الافتراضية، لأن Foundry يختار وحدات معالجة الرسومات لكل مثيل بناء على حجم النموذج، والهندسة المعمارية، وطول السياق، وما إذا كان عبء العمل محسنا لتأخير أو معدل النقل.
- التشغيلية المحسنة للاستنتاج — حاويات NIM VLLM وSGLang وNVIDIA المنسقة Microsoft مع التجميع المستمر، وفك الترميز الافتراضي، والتوازي في التنسور، والتبديل الساخن LoRA.
- عائلات المسرعات — A100 (80 جيجابايت)، H100 (80 جيجابايت)، H200 (141 جيجابايت)، وMI300X.
- التوسع التلقائي والتوسع إلى الصفر — التوسع التلقائي من حركة المرور الحية أو التوسع يدويا. قم بتكوين مهلة توقف في وضع الخمول بحيث يتدرج النشر إلى الصفر عند عدم وصول المرور، مما يجعل الفوترة تتوقف فورا.
Microsoft المدارة — Microsoft تمتلك أوقات التشغيل، وصور الحاويات الأساسية، وتصحيحات الأمان. يتم تطبيق التحديثات تلقائيا على النشرات الحية (live deploys). - مقاييس الملاحظة — كل نشر يصدر عدد استدعاءات API حسب رمز الحالة ونسبة زمن الاستجابة. نماذج إكمال المحادثة تصدر أيضا عدد رموز الإدخال والإخراج، ونسب الوقت إلى الرمز الأول (TTFT)، ونسب زمن الاستجابة الكلية، مجمعة حسب الوقت.
الفوترة والحصص
الفوترة المدارة للحوسبة تكون بالساعة لكل وحدة تخزين للمسرع، مع معدل النقل لكل وحدة معالجة رسومات كوحدة الفوترة الأساسية. يقوم التدرج التلقائي والتوسع إلى الصفر بمواءمة التكلفة مع حركة المرور الفعلية بحيث تتوقف الفوترة فورا، حيث يتم تقليل حجم الحالات.
تمنح الحصة لكل وحدة تخزين مسرعة لكل منطقة من خلال عملية حصة Foundry وهي منفصلة عن حصة Azure VM. آلات Azure الافتراضية هي عرض بنية تحتية كخدمة (IaaS) مع وحدات تخزين إقليمية؛ الحوسبة المدارة هي خدمة PaaS تقود معالجة المعالجة العالمية ومعالجة مناطق البيانات. لا يمكن تطبيق حصة Azure VM الحالية على نشر الحوسبة المدارة.
الحوسبة المدارة متاحة حاليا للنشر العالمي. للحصول على تقديرات الأسعار، راجع حاسبة التسعير Azure.
ابدأ
مقارنة خيارات النشر
استخدم النشر القياسي في موارد Foundry كلما أمكن. يقارن الجدول التالي القدرات عبر خياري النشر:
| القدرة | النشر القياسي في موارد Foundry | الحوسبة المدارة |
|---|---|---|
| أي النماذج يمكن نشرها؟ | جميع نماذج المساند، بما في ذلك Foundry Models، التي تباع بواسطة Azure وselect Models من الشركاء والمجتمع | نماذج مفتوحة المصدر وشركاء من كتالوج النماذج، NVIDIA NIM، ونماذج الصناعة |
| مورد النشر | مورد المسبك | مشروع المسبك |
| يتطلب مركز الذكاء الاصطناعي | لا | لا |
| خيارات معالجة البيانات | إقليمي، منطقة بيانات، عالمي | عام |
| الشبكات الخاصة | نعم | نعم |
| تصفية المحتوى | مدمج وقابل للتخصيص | غير متوفر في المعاينة العامة |
| المصادقة بدون مفتاح | نعم (معرف Microsoft Entra ID ويعتمد على المفاتيح) | نعم (معرف Microsoft Entra ID ويعتمد على المفاتيح) |
| التصنيف | استخدام الرموز أو وحدات النقل المخصصة | كل ساعة لكل وحدة تخزين مسرع |
نصيحة
للحصول على معلومات تفصيلية عن التسعير، راجع خطط وإدارة التكاليف ل Microsoft Foundry.