منظور Azure Well-Architected Framework على خدمة Azure OpenAI

مقالة
03/05/2024

توفر خدمة Azure OpenAI الوصول إلى واجهة برمجة تطبيقات REST إلى نماذج اللغات الكبيرة OpenAI (LLMs)، وإضافة إمكانات شبكة Azure والأمان. توفر هذه المقالة توصيات معمارية لمساعدتك في اتخاذ قرارات مستنيرة عند استخدام Azure OpenAI كجزء من بنية حمل العمل الخاص بك. تستند الإرشادات إلى ركائز Azure Well-Architected Framework.

هام

كيفية استخدام هذا الدليل

يحتوي كل قسم على قائمة اختيار التصميم التي تعرض المجالات المعمارية المثيرة للقلق جنبا إلى جنب مع استراتيجيات التصميم المترجمة إلى نطاق التكنولوجيا.

وتشمل أيضا توصيات بشأن القدرات التكنولوجية التي يمكن أن تساعد في تحقيق هذه الاستراتيجيات. لا تمثل التوصيات قائمة شاملة بجميع التكوينات المتاحة ل Azure OpenAI وتبعياته. بدلا من ذلك، يسردون التوصيات الرئيسية المعينة إلى وجهات نظر التصميم. استخدم التوصيات لبناء إثبات المفهوم أو تحسين بيئاتك الحالية.

البنية الأساسية التي توضح التوصيات الرئيسية: البنية المرجعية للدردشة الأساسية OpenAI الشاملة.

نطاق التكنولوجيا

تركز هذه المراجعة فقط على Azure OpenAI.

الموثوقية

الغرض من ركيزة الموثوقية هو توفير وظائف مستمرة من خلال بناء مرونة كافية والقدرة على التعافي بسرعة من حالات الفشل.

توفر مبادئ تصميم الموثوقية استراتيجية تصميم عالية المستوى تطبق على المكونات الفردية وتدفقات النظام والنظام ككل.

قائمة مراجعة التصميم

ابدأ استراتيجية التصميم الخاصة بك استنادا إلى قائمة التحقق من مراجعة التصميم للموثوقية. حدد مدى صلته بمتطلبات عملك. توسيع الاستراتيجية لتشمل المزيد من النهج حسب الحاجة.

المرونة: اختر خيار النشر المناسب إما للدفع أولا بأول أو معدل النقل المقدم استنادا إلى حالة الاستخدام الخاصة بك. نظرا لأن السعة المحجوزة تزيد من المرونة، اختر معدل النقل المقدم لحلول الإنتاج. يعد نهج الدفع أولا بأول مثاليا لبيئات التطوير/الاختبار.
التكرار: أضف البوابات المناسبة أمام عمليات توزيع Azure OpenAI. يجب أن يكون للبوابة القدرة على تحمل حالات الفشل العابرة مثل التقييد وكذلك التوجيه إلى مثيلات Azure OpenAI المتعددة. ضع في اعتبارك التوجيه إلى مثيلات في مناطق مختلفة لبناء التكرار الإقليمي.
المرونة: إذا كنت تستخدم معدل النقل المتوفر، ففكر أيضا في نشر مثيل الدفع أولا بأول للتعامل مع تجاوز التدفق. يمكنك توجيه المكالمات إلى مثيل الدفع أولا بأول عبر البوابة الخاصة بك عند تقييد نموذج معدل النقل المقدم. يمكنك أيضا استخدام المراقبة للتنبؤ بموعد تقييد النموذج وتوجيه المكالمات بشكل استباقي إلى مثيل الدفع أولا بأول.
المرونة: مراقبة استخدام السعة للتأكد من أنك لا تتجاوز حدود معدل النقل. راجع استخدام السعة بانتظام لتحقيق تنبؤ أكثر دقة والمساعدة في منع انقطاع الخدمة بسبب قيود السعة.
المرونة: اتبع إرشادات ملفات البيانات الكبيرة واستيراد البيانات من مخزن Azure blob. يمكن أن تصبح الملفات الكبيرة، 100 ميغابايت أو أكبر، غير مستقرة عند تحميلها من خلال نماذج متعددة الأجزاء لأن الطلبات ذرية ولا يمكن إعادة محاولة أو استئنافها.
الاسترداد: حدد استراتيجية استرداد تتضمن خطة استرداد للنماذج التي تم ضبطها بدقة ولبيانات التدريب التي تم تحميلها إلى Azure OpenAI. نظرا لأن Azure OpenAI لا يحتوي على تجاوز الفشل التلقائي، يجب عليك تصميم استراتيجية تشمل الخدمة بأكملها وجميع التبعيات، مثل التخزين الذي يحتوي على بيانات التدريب.

التوصيات

التوصية	الميزة
مراقبة حدود معدل الدفع أولا بأول: إذا كنت تستخدم نهج الدفع أولا بأول، فقم بإدارة حدود المعدل لعمليات توزيع النموذج ومراقبة استخدام الرموز المميزة في الدقيقة (TPM) والطلبات في الدقيقة (RPM).	توفر معلومات معدل النقل المهمة هذه المعلومات المطلوبة للتأكد من تعيين TPM كاف من حصتك النسبية لتلبية الطلب على عمليات التوزيع الخاصة بك. يؤدي تعيين حصة نسبية كافية إلى منع تقييد المكالمات إلى النماذج المنشورة.
مراقبة الاستخدام المدار بواسطة التوفير لمعدل النقل المقدم: إذا كنت تستخدم نموذج دفع معدل النقل المقدم ، فراقب الاستخدام المدار بواسطة التوفير.	من المهم مراقبة الاستخدام المدار بواسطة التوفير للتأكد من أنه لا يتجاوز 100٪، لمنع تقييد المكالمات إلى النماذج المنشورة.
تمكين ميزة الحصة النسبية الديناميكية: إذا كانت ميزانية حمل العمل تدعمها، فنفذ الإفراط في التوفير عن طريق تمكين الحصة النسبية الديناميكية على عمليات توزيع النموذج.	تسمح الحصة النسبية الديناميكية للتوزيع باستهلاك سعة أكبر مما تستهلكه حصتك عادة، طالما أن هناك سعة متاحة من منظور Azure. يمكن أن تمنع سعة الحصة الإضافية التقييد غير المرغوب فيه.
ضبط عوامل تصفية المحتوى: ضبط عوامل تصفية المحتوى لتقليل الإيجابيات الخاطئة من عوامل التصفية الشديدة.	تقوم عوامل تصفية المحتوى بحظر المطالبات أو الإكمالات استنادا إلى تحليل مخاطر مبهم. تأكد من ضبط عوامل تصفية المحتوى للسماح بالاستخدام المتوقع لحمل العمل الخاص بك.

الأمان

الغرض من ركيزة الأمان هو توفير ضمانات السرية والسلامة والتوافر لحمل العمل.

توفر مبادئ تصميم الأمان استراتيجية تصميم عالية المستوى لتحقيق هذه الأهداف من خلال تطبيق نهج على التصميم التقني حول Azure OpenAI.

قائمة مراجعة التصميم

ابدأ استراتيجية التصميم الخاصة بك استنادا إلى قائمة التحقق من مراجعة التصميم للأمان وتحديد الثغرات الأمنية وعناصر التحكم لتحسين وضع الأمان. ثم راجع أساس أمان Azure ل Azure OpenAI. وأخيرا، وسع الاستراتيجية لتشمل المزيد من النهج حسب الحاجة.

حماية السرية: إذا قمت بتحميل بيانات التدريب إلى Azure OpenAI، فاستخدم المفاتيح التي يديرها العميل لتشفير البيانات، وتنفيذ استراتيجية تدوير المفاتيح، وحذف بيانات التدريب والتحقق من الصحة ونتائج التدريب. إذا كنت تستخدم مخزن بيانات خارجيا لبيانات التدريب، فاتبع أفضل ممارسات الأمان لهذا المخزن. على سبيل المثال، بالنسبة إلى Azure Blob Storage، استخدم المفاتيح التي يديرها العميل للتشفير وتنفيذ استراتيجية تدوير المفاتيح. استخدم الوصول المدار المستند إلى الهوية، وقم بتنفيذ محيط الشبكة باستخدام نقاط النهاية الخاصة، وتمكين سجلات الوصول.
حماية السرية: الحماية من تسرب البيانات عن طريق الحد من عناوين URL الصادرة التي يمكن لموارد Azure OpenAI الوصول إليها.
حماية التكامل: تنفيذ عناصر التحكم في الوصول لمصادقة وصول المستخدم إلى النظام وتخويله باستخدام مبدأ أقل الامتيازات وباستخدام الهويات الفردية بدلا من المفاتيح.
حماية النزاهة: تنفيذ الكشف عن مخاطر الهروب من السجن لحماية عمليات توزيع نموذج اللغة من هجمات الحقن الفورية.
حماية التوفر: استخدم عناصر التحكم في الأمان لمنع الهجمات التي قد تستنفد حصص استخدام النموذج. يمكنك تكوين عناصر التحكم لعزل الخدمة على شبكة. إذا كان يجب الوصول إلى الخدمة من الإنترنت، ففكر في استخدام بوابة لحظر إساءة الاستخدام المشتبه بها باستخدام التوجيه أو التقييد.

التوصيات

التوصية	الميزة
المفاتيح الآمنة: إذا كانت بنيتك تتطلب مصادقة مستندة إلى مفتاح Azure OpenAI، فخزن هذه المفاتيح في Azure Key Vault، وليس في التعليمات البرمجية للتطبيق.	يؤدي فصل الأسرار عن التعليمات البرمجية عن طريق تخزينها في Key Vault إلى تقليل فرصة تسريب الأسرار. كما يسهل الفصل الإدارة المركزية للأسرار، مما يخفف من المسؤوليات مثل التناوب الرئيسي.
تقييد الوصول: قم بتعطيل الوصول العام إلى Azure OpenAI ما لم يتطلب حمل العمل الخاص بك ذلك. إنشاء نقاط نهاية خاصة إذا كنت تتصل من المستهلكين في شبكة Azure الظاهرية.	يساعد التحكم في الوصول إلى Azure OpenAI على منع الهجمات من المستخدمين غير المصرح لهم. يضمن استخدام نقاط النهاية الخاصة بقاء نسبة استخدام الشبكة خاصة بين التطبيق والنظام الأساسي.
Microsoft Entra ID: استخدم Microsoft Entra ID للمصادقة وتخويل الوصول إلى Azure OpenAI باستخدام التحكم في الوصول استنادا إلى الدور (RBAC). تعطيل المصادقة المحلية في Azure الذكاء الاصطناعي Services وتعيينها `disableLocalAuth` إلى `true`. امنح الهويات التي تقوم بالإكمال أو إنشاء الصور دور مستخدم OpenAI للخدمات المعرفية . امنح مسارات أتمتة النموذج وعلوم البيانات المخصصة الوصول إلى دور مثل Cognitive Services OpenAI Contributor.	يؤدي استخدام Microsoft Entra ID إلى مركزية مكون إدارة الهوية ويزيل استخدام مفاتيح واجهة برمجة التطبيقات. يضمن استخدام التحكم في الوصول استنادا إلى الدور مع Microsoft Entra ID أن المستخدمين أو المجموعات لديهم بالضبط الأذونات التي يحتاجونها للقيام بعملهم. هذا النوع من التحكم في الوصول الدقيق غير ممكن باستخدام مفاتيح Azure OpenAI API.
استخدام المفاتيح التي يديرها العميل: استخدم المفاتيح التي يديرها العميل للنماذج الدقيقة وبيانات التدريب التي يتم تحميلها إلى Azure OpenAI.	يمنحك استخدام المفاتيح التي يديرها العميل مرونة أكبر لإنشاء عناصر التحكم في الوصول وتدويرها وتعطيلها وإبطالها.
الحماية من هجمات الهروب من السجن: استخدم Azure الذكاء الاصطناعي Content Safety Studio للكشف عن مخاطر الهروب من السجن.	اكتشف محاولات الهروب من السجن لتحديد المطالبات التي تحاول تجاوز آليات الأمان لعمليات توزيع Azure OpenAI وحظرها.

تحسين التكلفة

يركز تحسين التكلفة على الكشف عن أنماط الإنفاق، وتحديد أولويات الاستثمارات في المجالات الهامة، والتحسين في مجالات أخرى لتلبية ميزانية المؤسسة مع تلبية متطلبات العمل.

اقرأ مبادئ تصميم Cost Optimization للتعرف على نهج تحقيق هذه الأهداف والمفاضلات الضرورية في خيارات التصميم التقني المتعلقة ب Azure OpenAI.

قائمة مراجعة التصميم

ابدأ استراتيجية التصميم الخاصة بك استنادا إلى قائمة التحقق من مراجعة التصميم لتحسين التكلفة للاستثمارات. قم بضبط التصميم بحيث يتوافق حمل العمل مع ميزانيته المخصصة. يجب أن يستخدم تصميمك إمكانات Azure المناسبة، ومراقبة الاستثمارات، والعثور على فرص لتحسينها بمرور الوقت.

إدارة التكلفة: تطوير نموذج التكلفة الخاص بك، مع مراعاة أحجام المطالبة. يساعدك فهم أحجام الإدخال والاستجابة الفورية وكيفية ترجمة النص إلى رموز مميزة على إنشاء نموذج تكلفة قابل للتطبيق.
تحسين الاستخدام: ابدأ بتسعير الدفع أولا بأول ل Azure OpenAI حتى يمكن التنبؤ باستخدام الرمز المميز الخاص بك.
تحسين المعدل: عندما يكون استخدام الرمز المميز مرتفعا بدرجة كافية ويمكن التنبؤ به على مدى فترة زمنية، استخدم نموذج تسعير معدل النقل المقدم لتحسين التكلفة بشكل أفضل.
تحسين الاستخدام: ضع في اعتبارك تسعير النموذج وقدراته عند اختيار النماذج. ابدأ بنماذج أقل تكلفة للمهام الأقل تعقيدا مثل إنشاء النص أو مهام الإكمال. بالنسبة للمهام الأكثر تعقيدا مثل ترجمة اللغة أو فهم المحتوى، ضع في اعتبارك استخدام نماذج أكثر تقدما. ضع في اعتبارك قدرات النموذج المختلفة والحد الأقصى لحدود استخدام الرمز المميز عند اختيار نموذج مناسب لحالات الاستخدام مثل تضمين النص أو إنشاء الصور أو سيناريوهات النسخ. من خلال تحديد النموذج الذي يناسب احتياجاتك بعناية، يمكنك تحسين التكاليف مع الاستمرار في تحقيق أداء التطبيق المطلوب.
تحسين الاستخدام: استخدم قيود الحد من الرمز المميز التي توفرها استدعاءات واجهة برمجة التطبيقات، مثل max_tokens و n، والتي تشير إلى عدد الإكمالات المراد إنشاؤها.
تحسين الاستخدام: تكبير نقاط توقف أسعار Azure OpenAI، على سبيل المثال، الضبط الدقيق ونقاط توقف النموذج مثل إنشاء الصور. نظرا لأن الضبط الدقيق يتم تحصيله في الساعة، فاستخدم الوقت المتوفر لديك في الساعة لتحسين نتائج الضبط الدقيق مع تجنب الانزلاق في فترة الفوترة التالية. وبالمثل، فإن تكلفة إنشاء 100 صورة هي نفسها تكلفة صورة واحدة. تكبير نقاط توقف الأسعار لصالحك.
تحسين الاستخدام: قم بإزالة النماذج الدقيقة غير المستخدمة عندما لا يتم استهلاكها لتجنب تكبد رسوم استضافة مستمرة.
ضبط الاستخدام: تحسين إدخال المطالبة وطول الاستجابة. ترفع المطالبات الأطول التكاليف عن طريق استهلاك المزيد من الرموز المميزة. ومع ذلك، لا تساعد المطالبات التي تفتقد إلى سياق كاف النماذج على تحقيق نتائج جيدة. إنشاء مطالبات موجزة توفر سياقا كافيا للنموذج لإنشاء استجابة مفيدة. تأكد أيضا من تحسين حد طول الاستجابة.
كفاءة التكلفة: طلبات الدفعات حيثما أمكن لتقليل النفقات العامة لكل استدعاء، مما يمكن أن يقلل من التكاليف الإجمالية. تأكد من تحسين حجم الدفعة.
كفاءة التكلفة: نظرا لأن النماذج لها تكاليف ضبط دقيقة مختلفة، ففكر في هذه التكاليف إذا كان الحل الخاص بك يتطلب ضبطا دقيقا.
المراقبة والتحسين: إعداد نظام تتبع التكلفة الذي يراقب استخدام النموذج. استخدم هذه المعلومات للمساعدة في إبلاغ خيارات النموذج وأحجام المطالبة.

التوصيات

التوصية	الميزة
تصميم التعليمات البرمجية للعميل لتعيين الحدود: يجب على عملائك المخصصين استخدام ميزات الحد لواجهة برمجة تطبيقات إكمال Azure OpenAI، مثل الحد الأقصى لعدد الرموز المميزة لكل نموذج (`max_tokens`) أو عدد الإكمالات للجيل (`n`). تضمن حدود الإعداد أن الخادم لا ينتج أكثر من احتياجات العميل.	يؤدي استخدام ميزات واجهة برمجة التطبيقات لتقييد الاستخدام إلى مواءمة استهلاك الخدمة مع احتياجات العميل. وهذا يوفر المال من خلال التأكد من أن النموذج لا يولد استجابة طويلة جدا تستهلك رموزا مميزة أكثر من اللازم.
مراقبة استخدام الدفع أولا بأول: إذا كنت تستخدم نهج الدفع أولا بأول، فراقب استخدام TPM وRPM. استخدم هذه المعلومات لإبلاغ قرارات التصميم المعماري مثل النماذج التي يجب استخدامها، وتحسين أحجام المطالبة.	توفر لك المراقبة المستمرة ل TPM وRPM مقاييس ذات صلة لتحسين تكلفة نماذج Azure OpenAI. يمكنك إقترن هذه المراقبة بميزات النموذج وتسعير النموذج لتحسين استخدام النموذج. يمكنك أيضا استخدام هذه المراقبة لتحسين أحجام المطالبة.
مراقبة استخدام معدل النقل المتوفر: إذا كنت تستخدم معدل النقل المتوفر، فراقب الاستخدام المدار بواسطة التزويد للتأكد من أنك لا تستخدم معدل النقل المتوفر الذي اشتريته بشكل ناقص.	تمنحك المراقبة المستمرة للاستخدام المدار بواسطة التزويد المعلومات التي تحتاج إلى فهمها إذا كنت لا تستخدم معدل النقل المقدم بشكل كبير.
إدارة التكلفة: استخدم ميزات إدارة التكاليف مع OpenAI لمراقبة التكاليف، وتعيين الميزانيات لإدارة التكاليف، وإنشاء تنبيهات لإعلام أصحاب المصلحة بالمخاطر أو الحالات الشاذة.	توفر مراقبة التكلفة وتعيين الميزانيات وتعيين التنبيهات الحوكمة مع عمليات المساءلة المناسبة.

التميز التشغيلي

يركز التميز التشغيلي بشكل أساسي على إجراءات ممارسات التطويروإمكانية المراقبةوإدارة الإصدار.

توفر مبادئ تصميم التميز التشغيلي استراتيجية تصميم عالية المستوى لتحقيق تلك الأهداف نحو المتطلبات التشغيلية لحمل العمل.

قائمة مراجعة التصميم

ابدأ استراتيجية التصميم الخاصة بك استنادا إلى قائمة التحقق من مراجعة التصميم للتميز التشغيلي. تحدد قائمة الاختيار هذه عمليات إمكانية الملاحظة والاختبار والتوزيع المتعلقة ب Azure OpenAI.

ثقافة Azure DevOps: تأكد من نشر مثيلات Azure OpenAI عبر بيئاتك المختلفة، مثل التطوير والاختبار والإنتاج. تأكد من أن لديك بيئات لدعم التعلم والتجريب المستمرين طوال دورة التطوير.
إمكانية الملاحظة: مراقبة المقاييس المناسبة وتجميعها وتصورها.
إمكانية الملاحظة: إذا كانت تشخيصات Azure OpenAI غير كافية لاحتياجاتك، ففكر في استخدام بوابة مثل Azure API Management أمام Azure OpenAI لتسجيل كل من المطالبات الواردة والاستجابات الصادرة عند السماح بذلك. يمكن أن تساعدك هذه المعلومات على فهم فعالية النموذج للمطالبات الواردة.
التوزيع بثقة: استخدم البنية الأساسية كتعلم برمجي (IaC) لنشر Azure OpenAI وعمليات توزيع النموذج والبنية الأساسية الأخرى المطلوبة لنماذج الضبط الدقيق.
التوزيع بثقة: اتبع ممارسات نماذج اللغة الكبيرة (LLMOps) لتشغيل إدارة Azure OpenAI LLMs، بما في ذلك النشر والضبط الدقيق والهندسة الفورية.
التشغيل التلقائي لتحقيق الكفاءة: إذا كنت تستخدم المصادقة المستندة إلى المفتاح، فنفذ استراتيجية تلقائية لتناوب المفاتيح.

التوصيات

التوصية	الميزة
تمكين وتكوين تشخيصات Azure: تمكين وتكوين التشخيصات لخدمة Azure OpenAI.	تجمع التشخيصات المقاييس والسجلات وتحللها، مما يساعدك على مراقبة توفر Azure OpenAI وأدائه وتشغيله.

كفاءة الأداء

تتعلق كفاءة الأداء بالحفاظ على تجربة المستخدم حتى عندما تكون هناك زيادة في الحمل عن طريق إدارة السعة. تتضمن الاستراتيجية تحجيم الموارد، وتحديد وتحسين الازدحامات المحتملة، وتحسين أداء الذروة.

توفر مبادئ تصميم كفاءة الأداء استراتيجية تصميم عالية المستوى لتحقيق أهداف السعة هذه مقابل الاستخدام المتوقع.

قائمة مراجعة التصميم

ابدأ استراتيجية التصميم الخاصة بك استنادا إلى قائمة التحقق من مراجعة التصميم لكفاءة الأداء لتحديد أساس يستند إلى مؤشرات الأداء الرئيسية لأحمال عمل Azure OpenAI.

السعة: تقدير متطلبات مرونة المستهلكين. تحديد نسبة استخدام الشبكة ذات الأولوية العالية التي تتطلب استجابات متزامنة وحركة مرور منخفضة الأولوية يمكن أن تكون غير متزامنة ومدفعية.
السعة: متطلبات استهلاك الرمز المميز القياسي استنادا إلى الطلبات المقدرة من المستهلكين. ضع في اعتبارك استخدام أداة قياس Azure OpenAI لمساعدتك في التحقق من صحة معدل النقل إذا كنت تستخدم عمليات توزيع وحدة معدل النقل (PTU) المتوفرة.
السعة: استخدم معدل النقل المقدم لأحمال عمل الإنتاج. يوفر معدل النقل المتوفر ذاكرة حوسبة مخصصة وسعة محجوزة وزمن انتقال أقصى متسق لإصدار النموذج المحدد. يمكن أن يعاني عرض الدفع أولا بأول من مشاكل الجوار المزعجة مثل زيادة زمن الانتقال والتقييد في المناطق الخاضعة للاستخدام الكثيف. كما أن نهج الدفع أولا بأول لا يوفر سعة مضمونة.
السعة: أضف البوابات المناسبة أمام عمليات توزيع Azure OpenAI. تأكد من أن البوابة يمكن أن توجه إلى مثيلات متعددة في نفس المناطق أو مناطق مختلفة.
السعة: تخصيص وحدات PTUs لتغطية الاستخدام المتوقع، وإكمال وحدات PTUs هذه بنشر TPM للتعامل مع المرونة أعلى من هذا الحد. يجمع هذا النهج بين معدل النقل الأساسي ومعدل النقل المرن لتحقيق الكفاءة. مثل الاعتبارات الأخرى، يتطلب هذا النهج تنفيذ بوابة مخصصة لتوجيه الطلبات إلى نشر TPM عند الوصول إلى حدود PTU.
السعة: إرسال طلبات ذات أولوية عالية بشكل متزامن. قائمة انتظار الطلبات ذات الأولوية المنخفضة وإرسالها على دفعات عندما يكون الطلب منخفضا.
السعة: حدد نموذجا يتوافق مع متطلبات الأداء الخاصة بك، مع مراعاة المفاضلة بين السرعة وتعقيد الإخراج. يمكن أن يختلف أداء النموذج بشكل كبير استنادا إلى نوع النموذج المختار. توفر النماذج المصممة للسرعة أوقات استجابة أسرع، والتي يمكن أن تكون مفيدة للتطبيقات التي تتطلب تفاعلات سريعة. وعلى العكس من ذلك، قد تقدم النماذج الأكثر تطورا مخرجات عالية الجودة على حساب زيادة وقت الاستجابة.
تحقيق الأداء: بالنسبة للتطبيقات مثل روبوتات الدردشة أو واجهات المحادثة، ضع في اعتبارك تنفيذ الدفق. يمكن أن يعزز البث الأداء المتصور لتطبيقات Azure OpenAI من خلال تقديم استجابات للمستخدمين بطريقة تزايدية، وتحسين تجربة المستخدم.
تحقيق الأداء: حدد وقت استخدام الضبط الدقيق قبل الالتزام بالضبط الدقيق. على الرغم من وجود حالات استخدام جيدة للضبط الدقيق، مثل عندما تكون المعلومات اللازمة لتوجيه النموذج طويلة جدا أو معقدة بحيث لا يمكن احتواؤها في المطالبة، فتأكد من أن نهج الهندسة السريعة والجيل المعزز باسترداد (RAG) لا تعمل أو أنها أكثر تكلفة على الأرجح.
تحقيق الأداء: ضع في اعتبارك استخدام عمليات توزيع النموذج المخصصة لكل مجموعة مستهلكين لتوفير عزل استخدام لكل نموذج يمكن أن يساعد في منع الجيران المزعجين بين مجموعات المستهلكين الخاصة بك.

التوصيات

لا توجد تكوينات موصى بها لكفاءة الأداء ل Azure OpenAI.

نهج Azure

يوفر Azure مجموعة واسعة من النهج المضمنة المتعلقة ب Azure OpenAI وتبعياته. يمكن تدقيق بعض التوصيات السابقة من خلال نهج Azure. ضع في اعتبارك تعريفات النهج التالية:

تعريفات نهج Azure هذه هي أيضا توصيات أفضل ممارسات أمان Azure Advisor ل Azure OpenAI.

الخطوات التالية

ضع في اعتبارك المقالات التالية كموارد توضح التوصيات المميزة في هذه المقالة.

استخدم هذه البنية المرجعية كمثال على كيفية تطبيق إرشادات هذه المقالة على حمل العمل: البنية المرجعية للدردشة الأساسية OpenAI من طرف إلى طرف.
بناء خبرة في التنفيذ باستخدام وثائق منتج التعلم الآلي من Microsoft Azure .

مشاركة عبر

منظور Azure Well-Architected Framework على خدمة Azure OpenAI

نطاق التكنولوجيا

الموثوقية

قائمة مراجعة التصميم

التوصيات

الأمان

قائمة مراجعة التصميم

التوصيات

تحسين التكلفة

قائمة مراجعة التصميم

التوصيات

التميز التشغيلي

قائمة مراجعة التصميم

التوصيات

كفاءة الأداء

قائمة مراجعة التصميم

التوصيات

نهج Azure

الخطوات التالية

الملاحظات

الملاحظات

الموارد الإضافية