الحدود والحصص النسبية لخدمة Azure OpenAI

تحتوي هذه المقالة على مرجع سريع ووصف مفصل للحصص النسبية والحدود ل Azure OpenAI في خدمات Azure الذكاء الاصطناعي.

مرجع الحدود والحصص النسبية

توفر لك الأقسام التالية دليلا سريعا للحصص النسبية والحدود الافتراضية التي تنطبق على Azure OpenAI:

اسم الحد قيمة الحد
موارد OpenAI لكل منطقة لكل اشتراك Azure 30
حدود الحصة النسبية الافتراضية DALL-E 2 طلبان متزامنان
حدود الحصة النسبية الافتراضية DALL-E 3 وحدتان للسعة (6 طلبات في الدقيقة)
حدود الحصة النسبية الافتراضية للهمس 3 طلبات في الدقيقة
الحد الأقصى للرمز المميزة للمطالبة لكل طلب يختلف لكل نموذج. لمزيد من المعلومات، راجع نماذج خدمة Azure OpenAI
الحد الأقصى من توزيعات النماذج المحسّنة 5
العدد الكلي لمهام التدريب لكل مورد 100
الحد الأقصى لمهام التدريب المتزامنة قيد التشغيل لكل مورد 1
الحد الأقصى لمهام التدريب في قائمة الانتظار 20
الحد الأقصى للملفات لكل مورد (ضبط دقيق) 50
الحجم الإجمالي لجميع الملفات لكل مورد (ضبط دقيق) 1 جيجابايت
الحد الأقصى لوقت مهمة التدريب (ستفشل المهمة في حالة تجاوزه) 720 ساعة
الحد الأقصى لحجم مهمة التدريب (الرموز المميزة في ملف التدريب) x (# من العهود) 2 مليار
الحد الأقصى لحجم جميع الملفات لكل تحميل (Azure OpenAI على بياناتك) 16 ميغابايت
الحد الأقصى للرقم أو الإدخالات في الصفيف باستخدام /embeddings 2048
الحد الأقصى لعدد الرسائل /chat/completions 2048
الحد الأقصى لعدد /chat/completions الدالات 128
الحد الأقصى لعدد /chat completions الأدوات 128
الحد الأقصى لعدد وحدات معدل النقل المتوفرة لكل عملية نشر 100,000
الحد الأقصى للملفات لكل مساعد/مؤشر ترابط 20
الحد الأقصى لحجم الملف للمساعدين والضبط الدقيق 512 ميغابايت
حد الرمز المميز المساعد حد 2,000,000 رمز مميز
صور GPT-4o القصوى لكل طلب (# من الصور في صفيف الرسائل/محفوظات المحادثات) 10
الرموز المميزة القصوى الافتراضية GPT-4 vision-preview وGPT-4 turbo-2024-04-09 16

قم بزيادة قيمة المعلمة max_tokens لتجنب الاستجابات المقتطعة. الرموز المميزة القصوى GPT-4o الافتراضية إلى 4096.

حدود الحصص الإقليمية

المنطقة GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V gpt-4o gpt-4o - GlobalStandard GPT-35-Turbo GPT-35-Turbo-Instruct Text-Embedding-Ada-002 text-embedding-3-small تضمين نص-3-كبير Babbage-002 Babbage-002 - finetune Davinci-002 Davinci-002 - finetune GPT-35-Turbo - finetune GPT-35-Turbo-1106 - finetune GPT-35-Turbo-0125 - finetune GPT-4 - finetune
australiaeast 40 كيلو بايت 80 كيلوبايت 80 كيلوبايت 30 كيلوبايت - - 300 كيلوبايت - 350 كيلو بايت - - - - - - - - - -
brazilsouth - - - - - - - - 350 كيلو بايت - - - - - - - - - -
canadaeast 40 كيلو بايت 80 كيلوبايت 80 كيلوبايت - - - 300 كيلوبايت - 350 كيلو بايت 350 كيلو بايت 350 كيلو بايت - - - - - - - -
eastus - - 80 كيلوبايت - 150 كيلو بايت
1 م
450 كيلو بايت
10 م
240 كيلو بايت 240 كيلو بايت 240 كيلو بايت 350 كيلو بايت 350 كيلو بايت - - - - - - - -
eastus2 - - 80 كيلوبايت - 150 كيلو بايت
1 م
450 كيلو بايت
10 م
300 كيلوبايت - 350 كيلو بايت 350 كيلو بايت 350 كيلو بايت - - - - 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت -
francecentral 20 K 60 كيلو بايت 80 كيلوبايت - - - 240 كيلو بايت - 240 كيلو بايت - 350 كيلو بايت - - - - - - - -
japaneast - - - 30 كيلوبايت - - 300 كيلوبايت - 350 كيلو بايت - 350 كيلو بايت - - - - - - - -
northcentralus - - 80 كيلوبايت - 150 كيلو بايت
1 م
450 كيلو بايت
10 م
300 كيلوبايت - 350 كيلو بايت - - 240 كيلو بايت 250 كيلو بايت 240 كيلو بايت 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت 100 آلاف
norwayeast - - 150 كيلو بايت - - - - - 350 كيلو بايت - - - - - - - - - -
southafricanorth - - - - - - - - 350 كيلو بايت - - - - - - - - - -
southcentralus - - 80 كيلوبايت - 150 كيلو بايت
1 م
450 كيلو بايت
10 م
240 كيلو بايت - 240 كيلو بايت - - - - - - - - - -
southindia - - 150 كيلو بايت - - - 300 كيلوبايت - 350 كيلو بايت - 350 كيلو بايت - - - - - - - -
وسط السويد 40 كيلو بايت 80 كيلوبايت 150 كيلو بايت 30 كيلوبايت 150 كيلو بايت
1 م
- 300 كيلوبايت 240 كيلو بايت 350 كيلو بايت - 350 كيلو بايت 240 كيلو بايت 250 كيلو بايت 240 كيلو بايت 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت 100 آلاف
شمال سويسرا 40 كيلو بايت 80 كيلوبايت - 30 كيلوبايت - - 300 كيلوبايت - 350 كيلو بايت - - - - - - - - - -
switzerlandwest - - - - - - - - - - - - 250 كيلو بايت - 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت -
uksouth - - 80 كيلوبايت - - - 240 كيلو بايت - 350 كيلو بايت - 350 كيلو بايت - - - - - - - -
westeurope - - - - - - 240 كيلو بايت - 240 كيلو بايت - - - - - - - - - -
westus - - 80 كيلوبايت 30 كيلوبايت 150 كيلو بايت
1 م
450 كيلو بايت
10 م
300 كيلوبايت - 350 كيلو بايت - - - - - - - - - -
westus3 - - 80 كيلوبايت - 150 كيلو بايت
1 م
450 كيلو بايت
10 م
- - 350 كيلو بايت - 350 كيلو بايت - - - - - - - -

حدود معدل gpt-4o

gpt-4o يقدم مستويات حد المعدل مع حدود أعلى لبعض أنواع العملاء.

معيار gpt-4o العالمي

المستوى حد الحصة النسبية في الرموز المميزة في الدقيقة (TPM) عدد الطلبات في الدقيقة
اتفاقية المؤسسة 10 م 60 كيلو بايت
الإعداد الافتراضي 450 كيلو بايت 2.7 كيلو بايت

M = مليون | K = ألف

gpt-4o standard

المستوى حد الحصة النسبية في الرموز المميزة في الدقيقة (TPM) عدد الطلبات في الدقيقة
اتفاقية المؤسسة 1 م 6 كيلو بايت
الإعداد الافتراضي 150 كيلو بايت 900

M = مليون | K = ألف

مستويات الاستخدام

تستخدم عمليات النشر القياسية العالمية البنية الأساسية العالمية ل Azure، وتوجيه حركة مرور العملاء ديناميكيا إلى مركز البيانات مع أفضل توفر لطلبات الاستدلال الخاصة بالعميل. وهذا يتيح زمن انتقال أكثر اتساقا للعملاء الذين لديهم مستويات منخفضة إلى متوسطة من نسبة استخدام الشبكة. قد يرى العملاء الذين لديهم مستويات عالية من الاستخدام المستمر المزيد من التغير في زمن انتقال الاستجابة.

يحدد حد الاستخدام مستوى الاستخدام الذي قد يرى العملاء أعلاه تغيرا أكبر في زمن انتقال الاستجابة. يتم تعريف استخدام العميل لكل نموذج وهو إجمالي الرموز المميزة المستهلكة عبر جميع عمليات التوزيع في جميع الاشتراكات في جميع المناطق لمستأجر معين.

معيار GPT-4o العالمي

النموذج مستويات الاستخدام شهريا
GPT-4o 1.5 مليار رمز مميز

أنواع العروض الأخرى

إذا كان اشتراك Azure مرتبطا ببعض أنواع العروض، فإن قيم الحصة النسبية القصوى أقل من القيم المشار إليها في الجداول أعلاه.

المستوى حد الحصة النسبية في الرموز المميزة في الدقيقة (TPM)
Azure للطلاب، الإصدارات التجريبية المجانية 1 كيلوبايت (جميع النماذج)
اشتراكات MSDN GPT 3.5 Turbo Series: 30 K
سلسلة GPT-4: 8 K
الاشتراكات الشهرية المستندة إلى بطاقة الائتمان 1 GPT 3.5 Turbo Series: 30 K
سلسلة GPT-4: 8 K

1 ينطبق هذا حاليا على نوع العرض 0003P

في مدخل Microsoft Azure، يمكنك عرض نوع العرض المقترن باشتراكك من خلال الانتقال إلى اشتراكك والتحقق من جزء نظرة عامة على الاشتراكات. يتوافق نوع العرض مع حقل الخطة في نظرة عامة على الاشتراك.

أفضل الممارسات العامة للبقاء ضمن حدود المعدل

لتقليل المشكلات المتعلقة بحدود المعدلات، من المستحسن استخدام التقنيات التالية:

  • تنفيذ منطق إعادة المحاولة في التطبيق الخاص بك.
  • تجنب التغييرات الحادة في حمل العمل. زيادة حمل العمل تدريجيًا.
  • اختبار أنماط زيادة التحميل المختلفة.
  • قم بزيادة الحصة النسبية المعينة للتوزيع الخاص بك. نقل الحصة النسبية من نشر آخر، إذا لزم الأمر.

كيفية طلب زيادة الحصص النسبية والحدود الافتراضية

يمكن إرسال طلبات زيادة الحصة النسبية من صفحة الحصص النسبية في Azure OpenAI Studio. يرجى ملاحظة أنه نظرا للطلب الهائل، يتم قبول طلبات زيادة الحصة النسبية وسيتم ملؤها بالترتيب الذي يتم استلامها به. سيتم منح الأولوية للعملاء الذين ينشئون نسبة استخدام الشبكة التي تستهلك تخصيص الحصة النسبية الحالية، وقد يتم رفض طلبك إذا لم يتم استيفاء هذا الشرط.

بالنسبة إلى حدود الأسعار الأخرى، يرجى إرسال طلب خدمة.

الخطوات التالية

استكشف كيفية إدارة الحصة النسبية لنشر Azure OpenAI. تعرف على المزيد حول النماذج الأساس التي تعمل على تشغيل Azure OpenAI.