نماذج فورية في Microsoft Foundry (معاينة)

النماذج الفورية تتيح لك مناداة أي نموذج مدعوم باسمه — دون الحاجة إلى نشر. أنشئ مشروع Foundry، وابدأ البرمجة، واستخدم أي نموذج متاح فورا.

المتطلبات المسبقه

  • اشتراك في Azure. أنشئ واحدة مجانا.
  • سجل الدخول إلى Microsoft Foundry. تأكد من تفعيل مفتاح New Foundry . تشير هذه الخطوات إلى Foundry (جديد).
  • مشروع Foundry في غرب الولايات المتحدة 3 (المنطقة الوحيدة المدعومة للنماذج الفورية أثناء المعاينة). إذا كنت بحاجة لإنشاء مشروع، راجع إنشاء مشروع.
  • دور مستخدم Foundry في المشروع أو الحساب.

مهم

تم تغيير اسم أدوار RBAC في Foundry مؤخرا. Foundry User، Foundry Owner، Foundry Account Owner، وFoundry Project Manager تم تسميتها سابقا Azure مستخدم الذكاء الاصطناعي، ومالك الذكاء الاصطناعي Azure، ومالك حساب Azure الذكاء الاصطناعي، ومدير Project الذكاء الاصطناعي Azure. قد ترى الأسماء السابقة في بعض الأماكن أثناء صدور إعادة التسمية. معرفات الأدوار والأذونات الأساسية لم تتغير عند إعادة الاسم.

ابدأ باستخدام النماذج فورا

مع النماذج الفورية، سير العمل بسيط — استخدم اسم نموذج فوري مدعوم في كودك. لا حاجة للنشر. نفس واجهة برمجة التطبيقات وSDK والعميل الذي تستخدمه بالفعل للنشر يعمل مع النماذج الفورية. لا يوجد SDK ثاني، ولا عميل منفصل، ولا تغييرات في الإعدادات.

التغيير الوحيد عن الكود القائم على النشر هو المعاملة model . في الكود أدناه، استبدل "gpt-5-mini" باسم أي نموذج فوري.

from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient

# Format: "https://resource_name.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"

# Create project and openai clients to call Foundry API
project = AIProjectClient(
    endpoint=PROJECT_ENDPOINT,
    credential=DefaultAzureCredential(),
)
openai = project.get_openai_client()

# Run a responses API call
response = openai.responses.create(
    model="gpt-5-mini",
    input="What is the size of France in square miles?",
)
print(f"Response output: {response.output_text}")

لماذا النماذج الفورية مهمة

  • تبديل النماذج عن طريق تغيير سلسلة واحدة — استخدم أي اسم نموذج فوري في السلسلة model= ، دون إنشاء أو حذف عمليات نشر.
  • نفس واجهة برمجة التطبيقات وSDK — نفس المكالمات تعمل لكل من النماذج الفورية والنشرات.
  • يعمل مع أدوات التطوير الخاصة بك — النماذج الفورية تتكامل مع خطوط أنابيب Foundry CLI وVS Code وCI/CD بنفس طريقة النشر.

الانتشارات لن تختفي. تظل الخيار الصحيح عندما تحتاج إلى معدل نقل محجوز، أو فلاتر محتوى مخصصة، أو إقامة بيانات، أو تكوينات مؤسسية متقدمة. النماذج الفورية تبسط تجربة البدء بحيث تصبح عمليات النشر شيئا ترتقي إليه، وليس بوابة يجب أن تتجاوز قبل استخدام نموذج.

النماذج المدعومة

النماذج الجديدة تدعم الوصول الفوري بشكل افتراضي عند إصدارها. يتم النظر في دعم النماذج الإضافية بناء على طلب العملاء.

لرؤية جميع الطرازات التي تدعم الوصول الفوري:

  1. افتح مشروعا في غرب US 3 في تجربة Foundry الجديدة،
  2. اختر اكتشاف في التنقل العلوي الأيمن، ثم النماذج في اللوحة اليسرى.
  3. في كتالوج النماذج، اختر خيار فوري تحت خيارات التطوير لعرض النماذج الفورية المتاحة.

يمكنك أيضا سرد النماذج الفورية بشكل برمجيا:

SUBSCRIPTION_ID="<your-subscription-id>"
LOCATION="westus3"

az rest --method get \
  --url "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.CognitiveServices/locations/$LOCATION/models?api-version=2025-06-01" \
  --output json \
| jq -r '(.value // .models // .)[]
  | select((.model.capabilities.instant // "false" | tostring | ascii_downcase) == "true")
  | .model.name' \
| sort -u

ملاحظة

خلال المعاينة، تتوفر نماذج فورية في المشاريع في غرب الولايات المتحدة 3 فقط.

قد تظهر بعض النماذج الفورية في القائمة حتى لو لم يكن اشتراكك يحتوي على حصة لها. لمزيد من المعلومات، راجع الحصص والحدود لنماذج المسبك.

متى تستخدم النماذج الفورية مقابل النشرات

السيناريو النهج الموصى به
البدء، النمذجة الأولية، أو التجريب النماذج الفورية
استخدام أحدث طراز مباشرة بعد الإصدار النماذج الفورية
تحتاج إلى سعة محجوزة أو معدل نقل متوقع النشر
يتطلب معدل نقل البيانات المخصص (PTU) النشر
أحتاج إقامة بيانات في منطقة محددة النشر
سياسات تصفية المحتوى المخصصة لكل نموذج النشر
الحواجز المخصصة لكل طراز النشر
تكوين خاص بنقطة النهاية (على سبيل المثال، يتم تثبيت النسخة لكل نقطة نهاية) النشر
تقسيم الحصص بدقة بين الفرق النشر
النماذج المضبوطة بدقة النشر

يمكن أن تتعايش النماذج الفورية والنشرات في نفس المشروع. يمكنك البدء بالنماذج الفورية وإنشاء عمليات نشر لاحقا مع تطور متطلباتك.

نسخ النماذج

بشكل افتراضي، النماذج الفورية تتجه إلى أحدث نسخة دائمة الخضرة من النموذج. لتثبيت نسخة معينة، أضف تاريخ الإصدار إلى اسم النموذج كلاحقة متبادلة:

ما تمر به model السلوك
model-name المسارات إلى أحدث إصدار
model-name-2025-04-01 المسارات إلى تلك النسخة المحددة

تثبيت النسخة هو اختياري. إذا كان تطبيقك يتطلب الاستقرار، أضف لاحقة الإصدار. وإلا، ستحصل دائما على أحدث إصدار تلقائيا.

كيف يتم استهلاك الحصة

النماذج الفورية تستمد من مخزون حصص عالمي لكل نموذج مخصص لاشتراكك. هذه الحصة منفصلة عن الحصة الإقليمية المستخدمة في عمليات النشر القياسية.

  • أنت لا تخصص أو تقسمن الحصة العالمية — فهي تشارك تلقائيا عبر جميع استخدامات النموذج الفورية في اشتراكك.
  • النشر العالمي للمعايير يحتفظ بجزء من حصتك العالمية. النماذج الفورية تستخدم السعة المتبقية.
  • أنواع النشر الأخرى (المعيار الإقليمي، المزود بالتميز) تستخدم حصة إقليمية منفصلة ولا تؤثر على سعة النموذج الفوري.
  • إذا تم تسريع طلبات النماذج الفورية، يمكنك طلب زيادة الحصة أو إنشاء نشر بسعة محجوزة.

لمزيد من التفاصيل حول كيفية تفاعل الحصص العالمية والإقليمية، راجع إدارة وزيادة الحصص.

ضوابط المؤسسات

القدرة طريقة العمل
نماذج أو مزودي الكتلة الخاصة تعريفات نهج Azure تنطبق على النماذج الفورية بنفس الطريقة التي تنطبق بها على عمليات النشر
تثبيت على نسخة نموذجية إضافة لاحقة الإصدار إلى اسم النموذج (انظر نسخ النماذج)
قم بتعطيل النماذج الفورية تماما يمكن للمسؤولين إيقاف النماذج الفورية على مستوى الاشتراك من خلال نهج Azure

لإزالة النماذج الفورية من الحساب، قم بتكوين الإعدادات عبر Bicep أو ARM REST.

حدث حسابك ب:

PATCH https://management.azure.com/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}?api-version=2026-01-15-preview
Authorization: Bearer {arm_token}
Content-Type: application/json

استخدم هذا النص لإغلاق الوصول الفوري للنماذج بشكل فعال:

{
  "properties": {
    "instant": {
      "raiPolicyName": "Microsoft.DefaultV2",
      "modelAllowList": []
    }
  }
}

مهم

جميع النماذج الفورية تستخدم حواجز ومرشحات محتوى افتراضية. ومع ذلك، لا يمكنك تكوين حواجز حماية مخصصة أو سياسات الذكاء الاصطناعي المسؤول (RAI) على أساس كل نموذج لكل نموذج للنماذج الفورية. يمكنك تعيين سياسة RAI افتراضية على مستوى الحساب عبر واجهة برمجة التطبيقات (API)، لكن هذه السياسة تنطبق بشكل موحد على جميع النماذج الفورية. إذا كنت بحاجة إلى سياسات تصفية محتوى مختلفة للنماذج الفردية، استخدم نشرا.

تصادمات أسماء النشر

لا يمكن للنشرات الجديدة استخدام اسم يطابق اسم نموذج موجود. إذا كان لديك نشر موجود يتصادم اسمه مع اسم نموذج، فإن النشر له الأولوية ولا يتوفر الوصول الفوري إلى النموذج لذلك الاسم في ذلك المشروع.

القيود أثناء المعاينة

  • متوفر فقط في غرب الولايات المتحدة 3 .
  • النماذج المضبوطة بدقة غير مدعومة. لاستخدام نموذج مضبوط بدقة، أنشئ نشرا.
  • الحواجز، سياسات RAI المخصصة، ومرشحات المحتوى غير قابلة للتكوين للنماذج الفورية.
  • فقط النماذج المدرجة في النماذج المدعومة مؤهلة.