نماذج خدمة Azure OpenAI

يتم تشغيل خدمة Azure OpenAI من خلال مجموعة متنوعة من النماذج ذات القدرات المختلفة ونقاط الأسعار. يختلف توفر النموذج حسب المنطقة. بالنسبة إلى GPT-3 والنماذج الأخرى التي ستتوقف في يوليو 2024، راجع نماذج خدمة Azure OpenAI القديمة.

النماذج ‏‏الوصف
GPT-4o وGPT-4 Turbo NEW أحدث نماذج Azure OpenAI الأكثر قدرة مع إصدارات متعددة الوسائط، والتي يمكن أن تقبل كل من النصوص والصور كإدخل.
GPT-4 مجموعة من النماذج التي تتحسن على GPT-3.5 ويمكنها فهم وإنشاء لغة طبيعية ورمز.
GPT-3.5 مجموعة من النماذج التي تتحسن على GPT-3 ويمكنها فهم وإنشاء لغة طبيعية ورمز.
عمليات التضمين مجموعة من النماذج التي يمكنها تحويل النص إلى شكل متجه رقمي لتسهيل تشابه النص.
DALL-E سلسلة من النماذج التي يمكن أن تولد الصور الأصلية من اللغة الطبيعية.
الهمس سلسلة من النماذج في المعاينة يمكنها نسخ الكلام وترجمته إلى نص.
تحويل النص إلى كلام (معاينة) سلسلة من النماذج في المعاينة يمكنها تركيب النص إلى كلام.

GPT-4o وGPT-4 Turbo

GPT-4o هو أحدث نموذج معاينة من OpenAI. يدمج GPT-4o النص والصور في نموذج واحد، ما يتيح له التعامل مع أنواع بيانات متعددة في وقت واحد. يعزز هذا النهج متعدد الوسائط الدقة والاستجابة في التفاعلات بين الإنسان والكمبيوتر. يطابق GPT-4o GPT-4 Turbo في مهام النص والترميز باللغة الإنجليزية مع تقديم أداء فائق بلغات غير إنجليزية ومهام الرؤية، ووضع معايير جديدة لقدرات الذكاء الاصطناعي.

ملعب الوصول المبكر

يمكن لعملاء Azure OpenAI الحاليين اختبار GPT-4o في New Azure OpenAI Studio Early Access Playground (معاينة).

لاختبار أحدث نموذج:

إشعار

  • يتوفر ملعب الوصول المبكر GPT-4o حاليا فقط للموارد في غرب الولايات المتحدة 3 وشرق الولايات المتحدة، ويقتصر على 10 طلبات كل خمس دقائق لكل اشتراك.
  • يتم تمكين مراقبة إساءة استخدام خدمة Azure OpenAI لجميع مستخدمي ملعب الوصول المبكر حتى إذا تمت الموافقة على التعديل؛ يتم تمكين عوامل تصفية المحتوى الافتراضية ولا يمكن تعديلها.
  • GPT-4o هو نموذج معاينة Azure OpenAI ولا يتوفر حاليا للنشر/الوصول المباشر لواجهة برمجة التطبيقات.
  1. انتقل إلى Azure OpenAI Studio في https://oai.azure.com/ وسجل الدخول باستخدام بيانات الاعتماد التي لديها حق الوصول إلى موارد OpenAI.
  2. حدد مورد Azure OpenAI في مناطق غرب الولايات المتحدة 3 أو شرق الولايات المتحدة . إذا لم يكن لديك مورد في إحدى هذه المناطق، فستحتاج إلى إنشاء مورد.
  3. من صفحة Azure OpenAI Studio الرئيسية، حدد زر ملعب الوصول المبكر (معاينة) من أسفل قسم بدء الاستخدام. (لن يتوفر هذا الزر إلا عند وجود مورد في يتم تحديد غرب الولايات المتحدة 3 أو شرق الولايات المتحدة .)
  4. الآن يمكنك البدء في طرح أسئلة النموذج تماما كما تفعل من قبل في ملعب الدردشة الحالي.

GPT-4 Turbo

GPT-4 Turbo هو نموذج كبير متعدد الوسائط (يقبل إدخالات النص أو الصورة ويولد نصا) يمكن أن يحل المشاكل الصعبة بدقة أكبر من أي من نماذج OpenAI السابقة. مثل GPT-3.5 Turbo، وتم تحسين نماذج GPT-4 القديمة GPT-4 Turbo للدردشة ويعمل بشكل جيد لمهام الإكمال التقليدية.

أحدث إصدار GA من GPT-4 Turbo هو:

  • gpt-4الإصدار:turbo-2024-04-09

هذا هو البديل لنماذج المعاينة التالية:

  • gpt-4الإصدار:1106-Preview
  • gpt-4الإصدار:0125-Preview
  • gpt-4الإصدار:vision-preview

الاختلافات بين OpenAI وAzure OpenAI GPT-4 Turbo GA Models

  • يدعم إصدار OpenAI من أحدث 0409 طراز توربو وضع JSON واستدعاء الوظيفة لجميع طلبات الاستدلال.
  • لا يدعم إصدار Azure OpenAI الأحدث turbo-2024-04-09 حاليا استخدام وضع JSON واستدعاء الدالة عند تقديم طلبات الاستدلال مع إدخال الصورة (الرؤية). تدعم طلبات الإدخال المستندة إلى النص (الطلبات بدون image_url الصور المضمنة) وضع JSON واستدعاء الدالة.

الاختلافات من معاينة رؤية gpt-4

  • لا يدعم Azure الذكاء الاصطناعي تكامل تحسينات رؤية محددة مع GPT-4 Turbo مع Vision للإصدار gpt-4:turbo-2024-04-09. يتضمن ذلك التعرف البصري على الحروف (OCR)، وتؤسس الكائنات، ومطالبات الفيديو، وتحسين معالجة بياناتك باستخدام الصور.

توفر GPT-4 Turbo المدار

  • gpt-4الإصدار:turbo-2024-04-09 متوفر لكل من عمليات النشر القياسية والمتوفرة. حاليا لا يدعم الإصدار المقدم من هذا النموذج طلبات استدلال الصورة/الرؤية. لا تقبل عمليات النشر المتوفرة لهذا النموذج سوى إدخال النص. تقبل عمليات نشر النموذج القياسي كلا من طلبات استدلال النص والصورة/الرؤية.

توافر المناطق

للحصول على معلومات حول التوفر الإقليمي للنموذج، راجع مصفوفة النموذج الخاصة بالنشر القياسي والموفر.

توزيع GPT-4 Turbo مع Vision GA

لنشر نموذج GA من واجهة مستخدم Studio، حدد GPT-4 ثم اختر turbo-2024-04-09 الإصدار من القائمة المنسدلة. ستكون الحصة النسبية الافتراضية gpt-4-turbo-2024-04-09 للنموذج هي نفس الحصة النسبية الحالية ل GPT-4-Turbo. راجع حدود الحصة الإقليمية.

GPT-4

GPT-4 هو سلف GPT-4 Turbo. يحتوي كل من طرازي GPT-4 وGPT-4 Turbo على اسم نموذج أساسي ل gpt-4. يمكنك التمييز بين طرازي GPT-4 و Turbo من خلال فحص إصدار النموذج.

  • gpt-4‏‏الإصدار0314
  • gpt-4‏‏الإصدار0613
  • gpt-4-32k‏‏الإصدار0613

يمكنك مشاهدة طول سياق الرمز المميز المدعوم من قبل كل نموذج في جدول ملخص النموذج.

نماذج GPT-4 وGPT-4 Turbo

  • يمكن استخدام هذه النماذج فقط مع واجهة برمجة تطبيقات إكمال الدردشة.

راجع إصدارات النموذج للتعرف على كيفية تعامل خدمة Azure OpenAI مع ترقيات إصدار النموذج، والعمل مع النماذج لمعرفة كيفية عرض إعدادات إصدار النموذج وتكوينها من عمليات نشر GPT-4.

معرف النموذج ‏‏الوصف الحد الأقصى للطلب (الرموز المميزة) بيانات التدريب (حتى)
gpt-4o (2024-05-13)
معاينة GPT-4o (Omni)
أحدث نموذج معاينة
- النص، معالجة الصور
- الدقة والاستجابة المحسنة
- التماثل مع مهام كتابة النصوص والترميز باللغة الإنجليزية مقارنة ب GPT-4 Turbo مع Vision
- أداء فائق في اللغات غير الإنجليزية وفي مهام الرؤية
- متوفر حاليا فقط عبر ملعب الوصول المبكر
- حاليا لا يوجد وصول إلى النشر/واجهة برمجة التطبيقات
الإدخال: 128,000
الإخراج: 4,096
أكتوبر 2023
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo with Vision
أحدث نموذج GA
- استبدال لجميع نماذج معاينة GPT-4 السابقة (vision-preview، 1106-Preview، 0125-Preview).
- يختلف توفر الميزة حاليا اعتمادا على أسلوب الإدخال ونوع النشر.
- لا يدعم التحسينات.
الإدخال: 128,000
الإخراج: 4,096
ديسمبر 2023
gpt-4 (0125-Preview)*
GPT-4 Turbo Preview
نموذج المعاينة
-استبدال 1106-معاينة
- أداء أفضل لإنشاء التعليمات البرمجية
- تقليل الحالات التي لا يكمل فيها النموذج مهمة
- وضع JSON
- استدعاء الدالة المتوازية
- إخراج قابل للتكرار (معاينة)
الإدخال: 128,000
الإخراج: 4,096
ديسمبر 2023
gpt-4 (معاينة الرؤية)
GPT-4 Turbo مع Vision Preview
نموذج المعاينة
- يقبل إدخال النص والصورة.
- يدعم التحسينات
- وضع JSON
- استدعاء الدالة المتوازية
- إخراج قابل للتكرار (معاينة)
الإدخال: 128,000
الإخراج: 4,096
أبريل 2023
gpt-4 (1106-Preview)
GPT-4 Turbo Preview
نموذج المعاينة
- وضع JSON
- استدعاء الدالة المتوازية
- إخراج قابل للتكرار (معاينة)
الإدخال: 128,000
الإخراج: 4,096
أبريل 2023
gpt-4-32k (0613) نموذج GA الأقدم
- استدعاء الدالة الأساسية باستخدام الأدوات
32,768 سبتمبر 2021
gpt-4 (0613) نموذج GA الأقدم
- استدعاء الدالة الأساسية باستخدام الأدوات
8,192 سبتمبر 2021
gpt-4-32k(0314) نموذج GA الأقدم
- معلومات الإيقاف
32,768 سبتمبر 2021
gpt-4 (0314) نموذج GA الأقدم
- معلومات الإيقاف
8,192 سبتمبر 2021

تنبيه

لا نوصي باستخدام نماذج المعاينة في الإنتاج. سنقوم بترقية جميع عمليات نشر نماذج المعاينة إما إلى إصدارات المعاينة المستقبلية أو إلى أحدث إصدار مستقر/GA. لا تتبع النماذج المعينة معاينة دورة حياة نموذج Azure OpenAI القياسية.

إشعار

gpt-4 سيتم إيقاف إصدار 0314 و gpt-4-32k في وقت لا يتجاوز 5 يوليو 2024. gpt-4 سيتم إيقاف إصدار 0613 و gpt-4-32k قبل 30 سبتمبر 2024. راجع تحديثات النموذج لسلوك ترقية النموذج.

  • إصدار GPT-4 0125-preview هو إصدار محدث من معاينة GPT-4 Turbo التي تم إصدارها مسبقا كإصدار 1106-preview.
  • يكمل GPT-4 الإصدار 0125-preview المهام مثل إنشاء التعليمات البرمجية بشكل أكثر اكتمالا مقارنة ب gpt-4-1106-preview. لهذا السبب، اعتمادا على المهمة، قد يجد العملاء أن GPT-4-0125-preview يولد المزيد من الإخراج مقارنة ب gpt-4-1106-preview. نوصي العملاء بمقارنة مخرجات النموذج الجديد. يعالج GPT-4-0125-preview أيضا الأخطاء في gpt-4-1106-preview مع معالجة UTF-8 للغات غير الإنجليزية.
  • إصدار turbo-2024-04-09 GPT-4 هو أحدث إصدار GA ويستبدل 0125-Previewو 1106-previewو vision-preview.

هام

  • gpt-4 ستتم ترقية الإصدارات 1106-Preview و0125-Preview و vision-preview بإصدار ثابت من gpt-4 في المستقبل. ستبدأ ترقية gpt-4 عمليات نشر الإصدارات 1106-Preview و0125-Preview و vision-preview إلى "التحديث التلقائي إلى الافتراضي" و"الترقية عند انتهاء صلاحيتها" بعد إصدار الإصدار الثابت. لكل عملية نشر، تتم ترقية إصدار النموذج دون انقطاع في الخدمة لمكالمات واجهة برمجة التطبيقات. يتم تنظيم الترقيات حسب المنطقة ومن المتوقع أن تستغرق عملية الترقية الكاملة أسبوعين. لن تتم ترقية gpt-4 عمليات نشر الإصدارات 1106-Preview و0125-Preview و vision-preview التي تم تعيينها إلى "No autoupgrade" وستتوقف عن العمل عند ترقية إصدار المعاينة في المنطقة. راجع إيقاف نموذج Azure OpenAI وإهماله لمزيد من المعلومات حول توقيت الترقية.

GPT-3.5

يمكن لنماذج GPT-3.5 فهم وإنشاء لغة طبيعية أو تعليمة برمجية. النموذج الأكثر قدرة وفعالية من حيث التكلفة في عائلة GPT-3.5 هو GPT-3.5 Turbo، والذي تم تحسينه للدردشة ويعمل بشكل جيد لمهام الإكمال التقليدية أيضا. يتوفر GPT-3.5 Turbo للاستخدام مع واجهة برمجة تطبيقات إكمال الدردشة. لدى GPT-3.5 Turbo Instruct قدرات text-davinci-003 مشابهة لاستخدام واجهة برمجة تطبيقات الإكمال بدلا من واجهة برمجة تطبيقات إكمال الدردشة. نوصي باستخدام GPT-3.5 Turbo وGPT-3.5 Turbo Instruct عبر نماذج GPT-3.5 وGPT-3 القديمة.

معرف النموذج ‏‏الوصف الحد الأقصى للطلب (الرموز المميزة) بيانات التدريب (حتى)
gpt-35-turbo (0125) جديد أحدث نموذج GA
- وضع JSON
- استدعاء الدالة المتوازية
- إخراج قابل للتكرار (معاينة)
- دقة أعلى في الاستجابة بالتنسيقات المطلوبة.
- إصلاح الخطأ الذي تسبب في مشكلة ترميز النص لمكالمات دالة غير اللغة الإنجليزية.
الإدخال: 16385
الإخراج: 4,096
سبتمبر 2021
gpt-35-turbo (1106) نموذج GA الأقدم
- وضع JSON
- استدعاء الدالة المتوازية
- إخراج قابل للتكرار (معاينة)
الإدخال: 16385
الإخراج: 4,096
سبتمبر 2021
gpt-35-turbo-instruct (0914) نقطة نهاية الإكمال فقط 4,097 سبتمبر 2021
gpt-35-turbo-16k (0613) نموذج GA الأقدم
- استدعاء الدالة الأساسية باستخدام الأدوات
16,384 سبتمبر 2021
gpt-35-turbo (0613) نموذج GA الأقدم
- استدعاء الدالة الأساسية باستخدام الأدوات
4,096 سبتمبر 2021
gpt-35-turbo1 (0301) نموذج GA الأقدم
- معلومات الإيقاف
4,096 سبتمبر 2021

لمعرفة المزيد حول كيفية التفاعل مع GPT-3.5 Turbo وواجهة برمجة تطبيقات إكمال الدردشة، تحقق من الكيفية المتعمقة.

1 سيقبل هذا النموذج الطلبات > 4096 رمزا مميزا. لا ينصح بتجاوز حد رمز الإدخال 4096 حيث يتم تحديد الإصدار الأحدث من النموذج عند 4096 رمزا مميزا. إذا واجهت مشكلات عند تجاوز 4096 رمز إدخال مميز مع هذا النموذج، فهذا التكوين غير مدعوم رسميا.

عمليات التضمين

text-embedding-3-large هو أحدث نموذج تضمين وأكثر قدرة. الترقية بين نماذج التضمين غير ممكنة. من أجل الانتقال من استخدام text-embedding-ada-002 إلى text-embedding-3-large ستحتاج إلى إنشاء تضمينات جديدة.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

في الاختبار، يبلغ OpenAI عن نماذج التضمين من الجيل الثالث الكبير والصغير التي تقدم متوسط أفضل لأداء استرداد متعدد اللغات مع معيار MIRACL مع الحفاظ على الأداء للمهام الإنجليزية باستخدام معيار MTEB .

معيار التقييم text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
متوسط MIRACL 31.4 44.0 54.9
متوسط MTEB 61.0 62.3 64.6

تدعم نماذج تضمين الجيل الثالث تقليل حجم التضمين عبر معلمة جديدة dimensions . عادة ما تكون عمليات التضمين الأكبر أكثر تكلفة من منظور الحوسبة والذاكرة والتخزين. القدرة على ضبط عدد الأبعاد يسمح بمزيد من التحكم في التكلفة الإجمالية والأداء. dimensions المعلمة غير معتمدة في جميع إصدارات مكتبة OpenAI 1.x Python، للاستفادة من هذه المعلمة نوصي بالترقية إلى أحدث إصدار: pip install openai --upgrade.

وجد اختبار معيار MTEB الخاص ب OpenAI أنه حتى عندما يتم تقليل أبعاد نموذج الجيل الثالث إلى أقل من text-embeddings-ada-002 1536 بعدا يظل الأداء أفضل قليلا.

DALL-E

تقوم نماذج DALL-E بإنشاء صور من مطالبات النص التي يوفرها المستخدم. يتوفر DALL-E 3 بشكل عام للاستخدام مع واجهات برمجة تطبيقات REST. DALL-E 2 وDALL-E 3 مع مجموعات SDK للعميل قيد المعاينة.

الهمس

يمكن استخدام نماذج الهمس لتحويل الكلام إلى نص.

يمكنك أيضا استخدام نموذج الهمس عبر واجهة برمجة تطبيقات النسخ الدفعي ل Azure الذكاء الاصطناعي Speech. راجع ما هو نموذج الهمس؟ لمعرفة المزيد حول وقت استخدام Azure الذكاء الاصطناعي Speech مقابل خدمة Azure OpenAI.

تحويل النص إلى كلام (معاينة)

يمكن استخدام نص OpenAI إلى نماذج الكلام، قيد المعاينة حاليا، لتجميع النص إلى كلام.

يمكنك أيضا استخدام نص OpenAI لأصوات الكلام عبر Azure الذكاء الاصطناعي Speech. لمعرفة المزيد، راجع نص OpenAI إلى أصوات الكلام عبر خدمة Azure OpenAI أو عبر دليل الكلام Azure الذكاء الاصطناعي.

جدول ملخص النموذج وتوافر المنطقة

إشعار

تغطي هذه المقالة بشكل أساسي توفر النموذج/المنطقة الذي ينطبق على جميع عملاء Azure OpenAI الذين لديهم أنواع نشر قياسية. يتمتع بعض العملاء المحددين بإمكانية الوصول إلى مجموعات النماذج/المناطق غير المدرجة في الجدول الموحد أدناه. لمزيد من المعلومات حول عمليات النشر المتوفرة، راجع إرشاداتنا المقدمة.

توفر نموذج التوزيع القياسي

المنطقة gpt-4، 0613 gpt-4، 1106-Preview gpt-4، 0125-Preview gpt-4، معاينة الرؤية gpt-4، turbo-2024-04-09 gpt-4-32k، 0613 gpt-35-turbo، 0301 gpt-35-turbo، 0613 gpt-35-turbo، 1106 gpt-35-turbo، 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct، 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 babbage-002، 1 dall-e-3، 3.0 davinci-002، 1 tts, 001 tts-hd، 001 الهمس، 001
australiaeast - - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - -
eastus - - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - -
وسط السويد - - - - - -
شمال سويسرا - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - -

لا يتضمن هذا الجدول ضبط التوفر الإقليمي، راجع قسم الضبط الدقيق المخصص للحصول على هذه المعلومات.

الحصة النسبية لنموذج التوزيع القياسي

تختلف الحصة النسبية الافتراضية للنماذج حسب النموذج والمنطقة. تخضع حدود الحصة النسبية الافتراضية للتغيير.

يتم وصف الحصة النسبية للنشر القياسي من حيث الرموز المميزة لكل دقيقة (TPM).

المنطقة GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Text-Embedding-Ada-002 text-embedding-3-small تضمين نص-3-كبير Babbage-002 Babbage-002 - finetune Davinci-002 Davinci-002 - finetune GPT-35-Turbo - finetune GPT-35-Turbo-1106 - finetune GPT-35-Turbo-0125 - finetune
australiaeast 40 كيلو بايت 80 كيلوبايت 80 كيلوبايت 30 كيلوبايت 300 كيلوبايت - 350 كيلو بايت - - - - - - - - -
brazilsouth - - - - - - 350 كيلو بايت - - - - - - - - -
canadaeast 40 كيلو بايت 80 كيلوبايت 80 كيلوبايت - 300 كيلوبايت - 350 كيلو بايت 350 كيلو بايت 350 كيلو بايت - - - - - - -
eastus - - 80 كيلوبايت - 240 كيلو بايت 240 كيلو بايت 240 كيلو بايت 350 كيلو بايت 350 كيلو بايت - - - - - - -
eastus2 - - 80 كيلوبايت - 300 كيلوبايت - 350 كيلو بايت 350 كيلو بايت 350 كيلو بايت - - - - 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت
francecentral 20 K 60 كيلو بايت 80 كيلوبايت - 240 كيلو بايت - 240 كيلو بايت - - - - - - - - -
japaneast - - - 30 كيلوبايت 300 كيلوبايت - 350 كيلو بايت - - - - - - - - -
northcentralus - - 80 كيلوبايت - 300 كيلوبايت - 350 كيلو بايت - - 240 كيلو بايت 250 كيلو بايت 240 كيلو بايت 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت
norwayeast - - 150 كيلو بايت - - - 350 كيلو بايت - - - - - - - - -
southafricanorth - - - - - - 350 كيلو بايت - - - - - - - - -
southcentralus - - 80 كيلوبايت - 240 كيلو بايت - 240 كيلو بايت - - - - - - - - -
southindia - - 150 كيلو بايت - 300 كيلوبايت - 350 كيلو بايت - - - - - - - - -
وسط السويد 40 كيلو بايت 80 كيلوبايت 150 كيلو بايت 30 كيلوبايت 300 كيلوبايت 240 كيلو بايت 350 كيلو بايت - - 240 كيلو بايت 250 كيلو بايت 240 كيلو بايت 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت
شمال سويسرا 40 كيلو بايت 80 كيلوبايت - 30 كيلوبايت 300 كيلوبايت - 350 كيلو بايت - - - - - - - - -
switzerlandwest - - - - - - - - - - 250 كيلو بايت - 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت 250 كيلو بايت
uksouth - - 80 كيلوبايت - 240 كيلو بايت - 350 كيلو بايت - - - - - - - - -
westeurope - - - - 240 كيلو بايت - 240 كيلو بايت - - - - - - - - -
westus - - 80 كيلوبايت 30 كيلوبايت 300 كيلوبايت - 350 كيلو بايت - - - - - - - - -
westus3 - - 80 كيلوبايت - - - 350 كيلو بايت - - - - - - - - -

1 كيلوبايت = 1000 رمز مميز لكل دقيقة (TPM). يتم تعريف العلاقة بين TPM والطلبات في الدقيقة (RPM) حاليا على أنها 6 RPM لكل 1000 TPM.

توفر نموذج التوزيع المتوفر

المنطقة gpt-4، 0613 gpt-4، 1106-Preview gpt-4، 0125-Preview gpt-4، turbo-2024-04-09 gpt-4-32k، 0613 gpt-35-turbo، 1106 gpt-35-turbo، 0125
australiaeast -
brazilsouth - - -
canadacentral - - - -
canadaeast - - - -
eastus -
eastus2 -
francecentral - -
germanywestcentral - -
japaneast - - - -
koreacentral - - - -
northcentralus -
norwayeast - - - -
بولندا المركزية -
southafricanorth - - -
southcentralus -
southindia -
وسط السويد
شمال سويسرا -
switzerlandwest - - - - - -
uksouth -
westus -
westus3

إشعار

الإصدار المقدم من gpt-4الإصدار:turbo-2024-04-09 يقتصر حاليا على النص فقط.

كيف أعمل الحصول على حق الوصول إلى المقدمة؟

تحتاج إلى التحدث مع فريق مبيعات/حساب Microsoft للحصول على معدل النقل المقدم. إذا لم يكن لديك فريق مبيعات/حساب، للأسف في هذا الوقت، لا يمكنك شراء معدل النقل المقدم.

لمزيد من المعلومات حول عمليات النشر المتوفرة، راجع إرشاداتنا المقدمة.

توفر نموذج GPT-4 وGPT-4 Turbo

مناطق السحابة العامة

المنطقة gpt-4، 0613 gpt-4، 1106-Preview gpt-4، 0125-Preview gpt-4، معاينة الرؤية gpt-4، turbo-2024-04-09 gpt-4-32k، 0613
australiaeast - -
canadaeast - - -
eastus - - - - -
eastus2 - - - -
francecentral - - -
japaneast - - - - -
northcentralus - - - - -
norwayeast - - - - -
southcentralus - - - - -
southindia - - - - -
وسط السويد -
شمال سويسرا - - -
uksouth - - - -
westus - - - -
westus3 - - - - -

تحديد وصول العميل

بالإضافة إلى المناطق أعلاه المتوفرة لجميع عملاء Azure OpenAI، تم منح بعض العملاء المحددين مسبقا حق الوصول إلى إصدارات GPT-4 في مناطق إضافية:

النموذج المنطقة
gpt-4 (0314) شرق الولايات المتحدة
وسط فرنسا
جنوب وسط الولايات المتحدة
جنوب المملكة المتحدة
gpt-4 (0613) شرق الولايات المتحدة
شرق الولايات المتحدة 2
شرق اليابان
جنوب المملكة المتحدة

مناطق Azure Government

تتوفر نماذج GPT-4 التالية مع Azure Government:

معرف النموذج توفر النموذج
gpt-4 (1106-Preview) ولاية فرجينيا الأمريكية
US Gov – أريزونا

نماذج GPT-3.5

هام

يحتوي النموذج الجديد gpt-35-turbo (0125) على تحسينات مختلفة، بما في ذلك دقة أعلى في الاستجابة بالتنسيقات المطلوبة وإصلاح خطأ تسبب في مشكلة ترميز النص لمكالمات دالة غير اللغة الإنجليزية.

يتم استخدام GPT-3.5 Turbo مع واجهة برمجة تطبيقات إكمال الدردشة. يمكن أيضا استخدام GPT-3.5 Turbo الإصدار 0301 مع واجهة برمجة تطبيقات الإكمال، على الرغم من أن هذا غير مستحسن. يدعم إصدارا GPT-3.5 Turbo 0613 و1106 فقط واجهة برمجة تطبيقات إكمال الدردشة.

GPT-3.5 Turbo الإصدار 0301 هو الإصدار الأول من النموذج الذي تم إصداره. الإصدار 0613 هو الإصدار الثاني من النموذج ويضيف دعم استدعاء الوظيفة.

راجع إصدارات النموذج للتعرف على كيفية معالجة خدمة Azure OpenAI لترقيات إصدار النموذج، والعمل مع النماذج لمعرفة كيفية عرض إعدادات إصدار النموذج وتكوينها من عمليات توزيع GPT-3.5 Turbo.

إشعار

gpt-35-turbo سيتم إيقاف إصدار 0613 و gpt-35-turbo-16k قبل 1 أغسطس 2024. gpt-35-turbo سيتم إيقاف إصدار 0301 من في وقت لا يتجاوز 1 أغسطس 2024. راجع تحديثات النموذج لسلوك ترقية النموذج.

توفر نموذج GPT-3.5-Turbo

مناطق السحابة العامة

المنطقة gpt-35-turbo، 0301 gpt-35-turbo، 0613 gpt-35-turbo، 1106 gpt-35-turbo، 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct، 0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
وسط السويد - -
شمال سويسرا - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

مناطق Azure Government

تتوفر نماذج توربو GPT-3.5 التالية مع Azure Government:

معرف النموذج توفر النموذج
gpt-35-turbo (1106-Preview) ولاية فرجينيا الأمريكية

نماذج التضمين

يمكن استخدام هذه النماذج فقط مع تضمين طلبات واجهة برمجة التطبيقات.

إشعار

text-embedding-3-large هو أحدث نموذج تضمين وأكثر قدرة. الترقية بين نماذج التضمين غير ممكنة. من أجل الترحيل من استخدام text-embedding-ada-002 إلى text-embedding-3-large ستحتاج إلى إنشاء تضمينات جديدة.

معرف النموذج الحد الأقصى للطلب (الرموز المميزة) أبعاد الإخراج بيانات التدريب (ما يصل إلى)
text-embedding-ada-002 (الإصدار 2) 8,191 1,536 سبتمبر 2021
text-embedding-ada-002 (الإصدار 1) 2,046 1,536 سبتمبر 2021
text-embedding-3-large 8,191 3,072 سبتمبر 2021
text-embedding-3-small 8,191 1,536 سبتمبر 2021

إشعار

عند إرسال صفيف من الإدخالات للتضمين، يكون الحد الأقصى لعدد عناصر الإدخال في الصفيف لكل استدعاء إلى نقطة نهاية التضمين هو 2048.

مناطق السحابة العامة

المنطقة text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - - -
japaneast - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
southcentralus - -
southindia - - -
وسط السويد - - -
شمال سويسرا - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

مناطق Azure Government

تتوفر نماذج Embeddings التالية مع Azure Government:

معرف النموذج توفر النموذج
text-embedding-ada-002 (الإصدار 2) ولاية فرجينيا الأمريكية
US Gov – أريزونا

نماذج DALL-E

معرف النموذج توفر الميزة الحد الأقصى للطلب (أحرف)
دال 2 (معاينة) شرق الولايات المتحدة 1,000
dall-e-3 شرق الولايات المتحدة، أستراليا الشرقية، السويد الوسطى 4,000

نماذج الضبط الدقيق

babbage-002 ولا davinci-002 يتم تدريبهم على اتباع التعليمات. يجب أن يتم الاستعلام عن هذه النماذج الأساسية فقط كنقطة إشارة إلى نسخة دقيقة لتقييم تقدم التدريب الخاص بك.

gpt-35-turbo - يقتصر ضبط هذا النموذج على مجموعة فرعية من المناطق، ولا يتوفر في كل منطقة يتوفر فيها النموذج الأساسي.

معرف النموذج مناطق الضبط الدقيق الحد الأقصى للطلب (الرموز المميزة) بيانات التدريب (حتى)
babbage-002 شمال وسط الولايات المتحدة
وسط السويد
غرب سويسرا
16,384 سبتمبر 2021
davinci-002 شمال وسط الولايات المتحدة
وسط السويد
غرب سويسرا
16,384 سبتمبر 2021
gpt-35-turbo (0613) شرق الولايات المتحدة 2
شمال وسط الولايات المتحدة
وسط السويد
غرب سويسرا
4,096 سبتمبر 2021
gpt-35-turbo (1106) شرق الولايات المتحدة 2
شمال وسط الولايات المتحدة
وسط السويد
غرب سويسرا
الإدخال: 16385
الإخراج: 4,096
سبتمبر 2021
gpt-35-turbo (0125) شرق الولايات المتحدة 2
شمال وسط الولايات المتحدة
وسط السويد
غرب سويسرا
16,385 سبتمبر 2021

نماذج الهمس

معرف النموذج توفر النموذج الحد الأقصى للطلب (حجم ملف الصوت)
whisper شرق الولايات المتحدة 2
شمال وسط الولايات المتحدة
شرق النرويج
جنوب الهند
وسط السويد
أوروبا الغربية
25 ميغابايت

نماذج تحويل النص إلى كلام (معاينة)

معرف النموذج توفر النموذج
tts-1 شمال وسط الولايات المتحدة
منطقة السويد الوسطى
tts-1-hd شمال وسط الولايات المتحدة
منطقة السويد الوسطى

مساعدون (معاينة)

بالنسبة إلى المساعدين، تحتاج إلى مزيج من نموذج مدعوم ومنطقة مدعومة. تتطلب بعض الأدوات والقدرات أحدث النماذج. تتوفر النماذج التالية في Assistants API وSDK وAzure الذكاء الاصطناعي Studio وAzure OpenAI Studio. الجدول التالي هو للدفع أولا بأول. للحصول على معلومات حول توفر وحدة معدل النقل (PTU)، راجع معدل النقل المقدم.

المنطقة gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
شرق أستراليا
شرق الولايات المتحدة
East US 2
وسط فرنسا
شرق النرويج
منطقة السويد الوسطى
جنوب المملكة المتحدة

الخطوات التالية