الحدود والحصص النسبية لخدمة Azure OpenAI
تحتوي هذه المقالة على مرجع سريع ووصف مفصل للحصص النسبية والحدود ل Azure OpenAI في خدمات Azure الذكاء الاصطناعي.
مرجع الحدود والحصص النسبية
توفر لك الأقسام التالية دليلا سريعا للحصص النسبية والحدود الافتراضية التي تنطبق على Azure OpenAI:
اسم الحد | قيمة الحد |
---|---|
موارد OpenAI لكل منطقة لكل اشتراك Azure | 30 |
حدود الحصة النسبية الافتراضية DALL-E 2 | طلبان متزامنان |
حدود الحصة النسبية الافتراضية DALL-E 3 | وحدتان للسعة (6 طلبات في الدقيقة) |
حدود الحصة النسبية الافتراضية للهمس | 3 طلبات في الدقيقة |
الحد الأقصى للرمز المميزة للمطالبة لكل طلب | يختلف لكل نموذج. لمزيد من المعلومات، راجع نماذج خدمة Azure OpenAI |
الحد الأقصى من توزيعات النماذج المحسّنة | 5 |
العدد الكلي لمهام التدريب لكل مورد | 100 |
الحد الأقصى لمهام التدريب المتزامنة قيد التشغيل لكل مورد | 1 |
الحد الأقصى لمهام التدريب في قائمة الانتظار | 20 |
الحد الأقصى للملفات لكل مورد (ضبط دقيق) | 50 |
الحجم الإجمالي لجميع الملفات لكل مورد (ضبط دقيق) | 1 جيجابايت |
الحد الأقصى لوقت مهمة التدريب (ستفشل المهمة في حالة تجاوزه) | 720 ساعة |
الحد الأقصى لحجم مهمة التدريب (الرموز المميزة في ملف التدريب) x (# من العهود) | 2 مليار |
الحد الأقصى لحجم جميع الملفات لكل تحميل (Azure OpenAI على بياناتك) | 16 ميغابايت |
الحد الأقصى للرقم أو الإدخالات في الصفيف باستخدام /embeddings |
2048 |
الحد الأقصى لعدد الرسائل /chat/completions |
2048 |
الحد الأقصى لعدد /chat/completions الدالات |
128 |
الحد الأقصى لعدد /chat completions الأدوات |
128 |
الحد الأقصى لعدد وحدات معدل النقل المتوفرة لكل عملية نشر | 100,000 |
الحد الأقصى للملفات لكل مساعد/مؤشر ترابط | 20 |
الحد الأقصى لحجم الملف للمساعدين والضبط الدقيق | 512 ميغابايت |
حد الرمز المميز المساعد | حد 2,000,000 رمز مميز |
صور GPT-4o القصوى لكل طلب (# من الصور في صفيف الرسائل/محفوظات المحادثات) | 10 |
الرموز المميزة القصوى الافتراضية GPT-4 vision-preview وGPT-4 turbo-2024-04-09 |
16 قم بزيادة قيمة المعلمة max_tokens لتجنب الاستجابات المقتطعة. الرموز المميزة القصوى GPT-4o الافتراضية إلى 4096. |
حدود الحصص الإقليمية
المنطقة | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | gpt-4o | gpt-4o - GlobalStandard | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Embedding-Ada-002 | text-embedding-3-small | تضمين نص-3-كبير | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-35-Turbo-0125 - finetune | GPT-4 - finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 كيلو بايت | 80 كيلوبايت | 80 كيلوبايت | 30 كيلوبايت | - | - | 300 كيلوبايت | - | 350 كيلو بايت | - | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | 350 كيلو بايت | - | - | - | - | - | - | - | - | - | - |
canadaeast | 40 كيلو بايت | 80 كيلوبايت | 80 كيلوبايت | - | - | - | 300 كيلوبايت | - | 350 كيلو بايت | 350 كيلو بايت | 350 كيلو بايت | - | - | - | - | - | - | - | - |
eastus | - | - | 80 كيلوبايت | - | 150 كيلو بايت 1 م |
450 كيلو بايت 10 م |
240 كيلو بايت | 240 كيلو بايت | 240 كيلو بايت | 350 كيلو بايت | 350 كيلو بايت | - | - | - | - | - | - | - | - |
eastus2 | - | - | 80 كيلوبايت | - | 150 كيلو بايت 1 م |
450 كيلو بايت 10 م |
300 كيلوبايت | - | 350 كيلو بايت | 350 كيلو بايت | 350 كيلو بايت | - | - | - | - | 250 كيلو بايت | 250 كيلو بايت | 250 كيلو بايت | - |
francecentral | 20 K | 60 كيلو بايت | 80 كيلوبايت | - | - | - | 240 كيلو بايت | - | 240 كيلو بايت | - | 350 كيلو بايت | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 كيلوبايت | - | - | 300 كيلوبايت | - | 350 كيلو بايت | - | 350 كيلو بايت | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 كيلوبايت | - | 150 كيلو بايت 1 م |
450 كيلو بايت 10 م |
300 كيلوبايت | - | 350 كيلو بايت | - | - | 240 كيلو بايت | 250 كيلو بايت | 240 كيلو بايت | 250 كيلو بايت | 250 كيلو بايت | 250 كيلو بايت | 250 كيلو بايت | 100 آلاف |
norwayeast | - | - | 150 كيلو بايت | - | - | - | - | - | 350 كيلو بايت | - | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | - | - | 350 كيلو بايت | - | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | 80 كيلوبايت | - | 150 كيلو بايت 1 م |
450 كيلو بايت 10 م |
240 كيلو بايت | - | 240 كيلو بايت | - | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 كيلو بايت | - | - | - | 300 كيلوبايت | - | 350 كيلو بايت | - | 350 كيلو بايت | - | - | - | - | - | - | - | - |
وسط السويد | 40 كيلو بايت | 80 كيلوبايت | 150 كيلو بايت | 30 كيلوبايت | 150 كيلو بايت 1 م |
- | 300 كيلوبايت | 240 كيلو بايت | 350 كيلو بايت | - | 350 كيلو بايت | 240 كيلو بايت | 250 كيلو بايت | 240 كيلو بايت | 250 كيلو بايت | 250 كيلو بايت | 250 كيلو بايت | 250 كيلو بايت | 100 آلاف |
شمال سويسرا | 40 كيلو بايت | 80 كيلوبايت | - | 30 كيلوبايت | - | - | 300 كيلوبايت | - | 350 كيلو بايت | - | - | - | - | - | - | - | - | - | - |
switzerlandwest | - | - | - | - | - | - | - | - | - | - | - | - | 250 كيلو بايت | - | 250 كيلو بايت | 250 كيلو بايت | 250 كيلو بايت | 250 كيلو بايت | - |
uksouth | - | - | 80 كيلوبايت | - | - | - | 240 كيلو بايت | - | 350 كيلو بايت | - | 350 كيلو بايت | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | 240 كيلو بايت | - | 240 كيلو بايت | - | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 كيلوبايت | 30 كيلوبايت | 150 كيلو بايت 1 م |
450 كيلو بايت 10 م |
300 كيلوبايت | - | 350 كيلو بايت | - | - | - | - | - | - | - | - | - | - |
westus3 | - | - | 80 كيلوبايت | - | 150 كيلو بايت 1 م |
450 كيلو بايت 10 م |
- | - | 350 كيلو بايت | - | 350 كيلو بايت | - | - | - | - | - | - | - | - |
حدود معدل gpt-4o
gpt-4o
يقدم مستويات حد المعدل مع حدود أعلى لبعض أنواع العملاء.
معيار gpt-4o العالمي
المستوى | حد الحصة النسبية في الرموز المميزة في الدقيقة (TPM) | عدد الطلبات في الدقيقة |
---|---|---|
اتفاقية المؤسسة | 10 م | 60 كيلو بايت |
الإعداد الافتراضي | 450 كيلو بايت | 2.7 كيلو بايت |
M = مليون | K = ألف
gpt-4o standard
المستوى | حد الحصة النسبية في الرموز المميزة في الدقيقة (TPM) | عدد الطلبات في الدقيقة |
---|---|---|
اتفاقية المؤسسة | 1 م | 6 كيلو بايت |
الإعداد الافتراضي | 150 كيلو بايت | 900 |
M = مليون | K = ألف
مستويات الاستخدام
تستخدم عمليات النشر القياسية العالمية البنية الأساسية العالمية ل Azure، وتوجيه حركة مرور العملاء ديناميكيا إلى مركز البيانات مع أفضل توفر لطلبات الاستدلال الخاصة بالعميل. وهذا يتيح زمن انتقال أكثر اتساقا للعملاء الذين لديهم مستويات منخفضة إلى متوسطة من نسبة استخدام الشبكة. قد يرى العملاء الذين لديهم مستويات عالية من الاستخدام المستمر المزيد من التغير في زمن انتقال الاستجابة.
يحدد حد الاستخدام مستوى الاستخدام الذي قد يرى العملاء أعلاه تغيرا أكبر في زمن انتقال الاستجابة. يتم تعريف استخدام العميل لكل نموذج وهو إجمالي الرموز المميزة المستهلكة عبر جميع عمليات التوزيع في جميع الاشتراكات في جميع المناطق لمستأجر معين.
معيار GPT-4o العالمي
النموذج | مستويات الاستخدام شهريا |
---|---|
GPT-4o |
1.5 مليار رمز مميز |
أنواع العروض الأخرى
إذا كان اشتراك Azure مرتبطا ببعض أنواع العروض، فإن قيم الحصة النسبية القصوى أقل من القيم المشار إليها في الجداول أعلاه.
المستوى | حد الحصة النسبية في الرموز المميزة في الدقيقة (TPM) |
---|---|
Azure للطلاب، الإصدارات التجريبية المجانية | 1 كيلوبايت (جميع النماذج) |
اشتراكات MSDN | GPT 3.5 Turbo Series: 30 K سلسلة GPT-4: 8 K |
الاشتراكات الشهرية المستندة إلى بطاقة الائتمان 1 | GPT 3.5 Turbo Series: 30 K سلسلة GPT-4: 8 K |
1 ينطبق هذا حاليا على نوع العرض 0003P
في مدخل Microsoft Azure، يمكنك عرض نوع العرض المقترن باشتراكك من خلال الانتقال إلى اشتراكك والتحقق من جزء نظرة عامة على الاشتراكات. يتوافق نوع العرض مع حقل الخطة في نظرة عامة على الاشتراك.
أفضل الممارسات العامة للبقاء ضمن حدود المعدل
لتقليل المشكلات المتعلقة بحدود المعدلات، من المستحسن استخدام التقنيات التالية:
- تنفيذ منطق إعادة المحاولة في التطبيق الخاص بك.
- تجنب التغييرات الحادة في حمل العمل. زيادة حمل العمل تدريجيًا.
- اختبار أنماط زيادة التحميل المختلفة.
- قم بزيادة الحصة النسبية المعينة للتوزيع الخاص بك. نقل الحصة النسبية من نشر آخر، إذا لزم الأمر.
كيفية طلب زيادة الحصص النسبية والحدود الافتراضية
يمكن إرسال طلبات زيادة الحصة النسبية من صفحة الحصص النسبية في Azure OpenAI Studio. يرجى ملاحظة أنه نظرا للطلب الهائل، يتم قبول طلبات زيادة الحصة النسبية وسيتم ملؤها بالترتيب الذي يتم استلامها به. سيتم منح الأولوية للعملاء الذين ينشئون نسبة استخدام الشبكة التي تستهلك تخصيص الحصة النسبية الحالية، وقد يتم رفض طلبك إذا لم يتم استيفاء هذا الشرط.
بالنسبة إلى حدود الأسعار الأخرى، يرجى إرسال طلب خدمة.
الخطوات التالية
استكشف كيفية إدارة الحصة النسبية لنشر Azure OpenAI. تعرف على المزيد حول النماذج الأساس التي تعمل على تشغيل Azure OpenAI.
الملاحظات
https://aka.ms/ContentUserFeedback.
قريبًا: خلال عام 2024، سنتخلص تدريجيًا من GitHub Issues بوصفها آلية إرسال ملاحظات للمحتوى ونستبدلها بنظام ملاحظات جديد. لمزيد من المعلومات، راجعإرسال الملاحظات وعرضها المتعلقة بـ