البنية الأساسية لمرجع الدردشة من طرف إلى طرف OpenAI

Azure OpenAI Service
Azure Machine Learning
Azure App Service
Azure Key Vault
Azure Monitor

توفر هذه المقالة بنية أساسية مخصصة للتعرف على تشغيل تطبيقات الدردشة التي تستخدم نماذج لغة خدمة Azure OpenAI. تتضمن البنية واجهة مستخدم عميل تعمل في Azure App Service وتستخدم تدفق المطالبة لتنسيق سير العمل من المطالبات الواردة إلى مخازن البيانات لجلب بيانات الأساس لنموذج اللغة. يتم نشر التدفق القابل للتنفيذ إلى نقطة نهاية مدارة عبر الإنترنت مع حساب مدار. تم تصميم البنية للعمل من منطقة واحدة.

هام

لا يقصد بهذه البنية أن تستخدم لتطبيقات الإنتاج. تهدف إلى أن تكون بنية تمهيدية يمكنك استخدامها لأغراض التعلم وإثبات المفهوم (POC). عند تصميم تطبيقات دردشة مؤسسة الإنتاج، راجع البنية المرجعية للدردشة الأساسية OpenAI الشاملة، والتي توسع هذه البنية الأساسية مع قرارات تصميم الإنتاج الإضافية.

هام

يتم دعم الإرشادات من خلال تطبيق مثال يتضمن خطوات عمليات النشر لتنفيذ الدردشة الأساسية الشاملة هذه. يمكن استخدام هذا التنفيذ كأساس ل POC الخاص بك لتجربة العمل مع تطبيقات الدردشة التي تستخدم Azure OpenAI.

بناء الأنظمة

رسم تخطيطي يوضح بنية الدردشة الأساسية الشاملة.

الشكل 1: بنية الدردشة الأساسية الشاملة باستخدام Azure OpenAI

قم بتنزيل ملف Visio لهذه البنية.

‏‏سير العمل‬

  1. يصدر المستخدم طلب HTTPS إلى المجال الافتراضي لخدمة التطبيق على azurewebsites.net. يشير هذا المجال تلقائيا إلى عنوان IP العام المضمن في App Service. يتم إنشاء اتصال أمان طبقة النقل (TLS) من العميل مباشرة إلى App Service. تتم إدارة الشهادة بالكامل بواسطة Azure.
  2. يضمن Easy Auth، إحدى ميزات Azure App Service، مصادقة المستخدم الذي يصل إلى الموقع باستخدام معرف Microsoft Entra.
  3. تعالج التعليمة البرمجية لتطبيق العميل المنشورة في App Service الطلب وتقدم للمستخدم واجهة مستخدم دردشة. يتصل رمز واجهة مستخدم الدردشة بواجهات برمجة التطبيقات المستضافة أيضا في مثيل App Service نفسه. تتصل التعليمات البرمجية لواجهة برمجة التطبيقات بنقطة نهاية مدارة عبر الإنترنت التعلم الآلي Azure لمعالجة تفاعلات المستخدم.
  4. توجه نقطة النهاية المدارة عبر الإنترنت الطلب إلى Azure التعلم الآلي الحوسبة المدارة حيث يتم نشر منطق تنسيق تدفق المطالبة.
  5. يبدأ تنفيذ التعليمة البرمجية لتنسيق تدفق المطالبة. من بين أمور أخرى، يستخرج المنطق استعلام المستخدم من الطلب.
  6. يتصل منطق التنسيق ب Azure الذكاء الاصطناعي Search لجلب بيانات الأساس للاستعلام. تتم إضافة بيانات الأساس إلى المطالبة التي يتم إرسالها إلى Azure OpenAI في الخطوة التالية.
  7. يتصل منطق التنسيق ب Azure OpenAI ويرسل المطالبة التي تتضمن بيانات الأساس ذات الصلة.
  8. يتم تسجيل المعلومات حول الطلب الأصلي إلى App Service واستدعاء نقطة النهاية المدارة عبر الإنترنت في Application Insights، باستخدام نفس مساحة عمل Log Analytics التي تتدفق إليها بيانات تتبع الاستخدام Azure OpenAI.

تدفق المطالبة

بينما يتضمن سير العمل تدفق تطبيق الدردشة، توضح القائمة التالية تدفق المطالبة النموذجي بمزيد من التفاصيل.

إشعار

لا تتوافق الأرقام الموجودة في هذا التدفق مع الأرقام الموجودة في الرسم التخطيطي للبنية.

  1. يدخل المستخدم مطالبة في واجهة مستخدم دردشة مخصصة (UI).
  2. ترسل التعليمة البرمجية لواجهة برمجة التطبيقات هذا النص لمطالبة التدفق.
  3. يستخرج تدفق المطالبة هدف المستخدم، إما سؤالا أو توجيها، من المطالبة.
  4. اختياريا، يحدد تدفق المطالبة مخازن البيانات التي تحتوي على البيانات ذات الصلة بمطالبة المستخدم.
  5. يستعلم التدفق السريع عن مخازن البيانات ذات الصلة.
  6. يرسل تدفق المطالبة الهدف وبيانات التأريض ذات الصلة وأي محفوظات مقدمة في المطالبة إلى نموذج اللغة.
  7. يقوم تدفق المطالبة بإرجاع النتيجة بحيث يمكن عرضها على واجهة المستخدم.

يمكن تنفيذ منسق التدفق بأي عدد من اللغات ونشره في خدمات Azure المختلفة. تستخدم هذه البنية تدفق المطالبة لأنها توفر تجربة مبسطة لإنشاء التدفقات التي تنسق بين المطالبات ومخازن البيانات الخلفية ونماذج اللغة واختبارها ونشرها.

المكونات

العديد من مكونات هذه البنية هي نفس الموارد في بنية تطبيق ويب App Service الأساسية لأن واجهة مستخدم الدردشة تستند إلى تلك البنية. تركز المكونات المميزة في هذا القسم على المكونات المستخدمة لإنشاء تدفقات الدردشة وخدمات البيانات والخدمات التي تعرض نماذج اللغة وتنسيقها.

  • Azure الذكاء الاصطناعي Studio هو نظام أساسي يمكنك استخدامه لإنشاء حلول الذكاء الاصطناعي واختبارها ونشرها. يتم استخدام الذكاء الاصطناعي Studio في هذه البنية لإنشاء منطق تنسيق تدفق المطالبة واختباره ونشره لتطبيق الدردشة.

    • الذكاء الاصطناعي Studio Hub هو مورد المستوى الأعلى ل الذكاء الاصطناعي Studio. إنه المورد المركزي حيث يمكنك التحكم في موارد الأمان والاتصال والحوسبة للاستخدام في مشاريع الذكاء الاصطناعي Studio. يمكنك تعريف الاتصالات بموارد مثل Azure OpenAI في الذكاء الاصطناعي Studio Hub. ترث الذكاء الاصطناعي Studio Projects هذه الاتصالات.

    • الذكاء الاصطناعي Studio Projects هي البيئات المستخدمة للتعاون أثناء تطوير النماذج والحلول الذكاء الاصطناعي ونشرها وتقييمها.

  • تدفق المطالبة هو أداة تطوير يمكنك استخدامها لإنشاء وتقييم ونشر التدفقات التي تربط مطالبات المستخدم والإجراءات من خلال التعليمات البرمجية ل Python والمكالمات إلى نماذج تعلم اللغة. يتم استخدام تدفق المطالبة في هذه البنية كطبقة تنسق التدفقات بين المطالبة ومخازن البيانات المختلفة ونموذج اللغة. للتطوير، يمكنك استضافة تدفقات المطالبة في نوعين من أوقات التشغيل.

    • وقت التشغيل التلقائي: خيار حساب بلا خادم يدير دورة الحياة وخصائص الأداء للحساب ويسمح بتخصيص البيئة المستندة إلى التدفق. تستخدم هذه البنية وقت التشغيل التلقائي للتبسيط.

    • وقت تشغيل مثيل الحوسبة: خيار حساب دائم حيث يجب على فريق حمل العمل تحديد خصائص الأداء. يوفر وقت التشغيل هذا المزيد من التخصيص والتحكم في البيئة.

  • التعلم الآلي هي خدمة سحابية مدارة يمكنك استخدامها لتدريب نماذج التعلم الآلي ونشرها وإدارتها. تستخدم هذه البنية ميزة من التعلم الآلي المستخدمة لنشر واستضافة تدفقات قابلة للتنفيذ لتطبيقات الذكاء الاصطناعي التي يتم تشغيلها بواسطة نماذج اللغة. هذه الميزة هي نقاط النهاية المدارة عبر الإنترنت التي تتيح لك نشر تدفق للاستدلال في الوقت الحقيقي. في هذه البنية، يتم استخدامها كنقطة نهاية PaaS لواجهة مستخدم الدردشة لاستدعاء تدفقات المطالبة التي يستضيفها وقت التشغيل التلقائي التعلم الآلي.

  • يتم استخدام التخزين لاستمرار ملفات مصدر تدفق المطالبة لتطوير تدفق المطالبة.

  • يتيح لك Container Registry إنشاء صور الحاوية والبيانات الاصطناعية وتخزينها وإدارتها في سجل خاص لجميع أنواع عمليات نشر الحاويات. في هذه البنية، يتم حزم التدفقات كصور حاوية وتخزينها في Container Registry.

  • Azure OpenAI هي خدمة مدارة بالكامل توفر وصول REST API إلى نماذج لغة Azure OpenAI، بما في ذلك GPT-4 وGPT-3.5-Turbo ومجموعة التضمينات من النماذج. في هذه البنية، بالإضافة إلى الوصول إلى النموذج، يتم استخدامه لإضافة ميزات المؤسسة الشائعة مثل دعم الهوية المدارة وتصفية المحتوى.

  • Azure الذكاء الاصطناعي Search هي خدمة بحث سحابية تدعم البحث في النص الكامل والبحث الدلالي والبحث المتجه والبحث المختلط. يتم تضمين الذكاء الاصطناعي Search في البنية لأنها خدمة شائعة تستخدم في التدفقات خلف تطبيقات الدردشة. يمكن استخدام الذكاء الاصطناعي Search لاسترداد البيانات ذات الصلة باستعلامات المستخدم وفهرستها. ينفذ تدفق المطالبة نمط RAG Retrieval Augmented Generation لاستخراج الاستعلام المناسب من المطالبة والاستعلام الذكاء الاصطناعي Search واستخدام النتائج كبيانات أساس لنموذج Azure OpenAI.

التوصيات والاعتبارات

ترتبط المكونات المدرجة في هذه البنية بأدلة خدمة Azure Well-Architected حيث توجد. دليل الخدمة تفاصيل التوصيات والاعتبارات لخدمات محددة. يوسع هذا القسم هذا التوجيه من خلال تمييز توصيات واعتبارات Azure Well-Architected Framework الرئيسية التي تنطبق على هذه البنية. لمزيد من المعلومات، يرجى مراجعةMicrosoft Azure Well-Architected Framework.

هذه البنية الأساسية غير مخصصة لنشر الإنتاج. تفضل البنية البساطة وكفاءة التكلفة على الوظائف للسماح لك بتقييم وتعلم كيفية إنشاء تطبيقات الدردشة الشاملة باستخدام Azure OpenAI. توضح الأقسام التالية بعض أوجه القصور في هذه البنية الأساسية، جنبا إلى جنب مع التوصيات والاعتبارات.

الموثوقيه

تضمن الموثوقية أن التطبيق الخاص بك يمكن أن يفي بالالتزامات التي تتعهد بها لعملائك. لمزيد من المعلومات، راجع قائمة اختيار مراجعة التصميم للموثوقية.

نظرا لأن هذه البنية غير مصممة لتوزيع الإنتاج، يوضح التالي بعض ميزات الموثوقية الهامة التي تم حذفها في هذه البنية:

  • تم تكوين خطة خدمة التطبيق للطبقة Basic ، والتي لا تحتوي على دعم منطقة توفر Azure. تصبح خدمة التطبيق غير متوفرة في حالة وجود أي مشكلة في المثيل أو الحامل أو مركز البيانات الذي يستضيف المثيل. أثناء الانتقال نحو الإنتاج، اتبع الإرشادات الواردة في قسم الموثوقية في تطبيق الويب المتكرر في المنطقة الأساسية المتوفرة بشكل كبير.
  • لا يتم تمكين التحجيم التلقائي لواجهة مستخدم العميل في هذه البنية الأساسية. لمنع مشكلات الموثوقية بسبب نقص موارد الحوسبة المتاحة، ستحتاج إلى الإفراط في التزويد للتشغيل دائما مع حساب كاف للتعامل مع الحد الأقصى للسعة المتزامنة.
  • لا تقدم حوسبة Azure التعلم الآلي الدعم لمناطق التوفر. يصبح المنسق غير متوفر في حالة وجود أي مشكلة في المثيل أو الحامل أو مركز البيانات الذي يستضيف المثيل. راجع التكرار النطاقي لعمليات نشر التدفق في بنية الأساس لمعرفة كيفية نشر منطق التنسيق إلى البنية الأساسية التي تدعم مناطق التوفر.
  • لا يتم تنفيذ Azure OpenAI في تكوين عالي التوفر. لمعرفة كيفية تنفيذ Azure OpenAI بطريقة موثوق بها، راجع Azure OpenAI - الموثوقية في البنية الأساسية.
  • تم تكوين Azure الذكاء الاصطناعي Search للطبقة Basic ، والتي لا تحتوي على دعم منطقة توفر Azure. لتحقيق التكرار النطاقي، انشر الذكاء الاصطناعي Search مع مستوى التسعير القياسي أو أعلى في منطقة تدعم مناطق التوفر، وانشر ثلاث نسخ متماثلة أو أكثر.
  • لا يتم تنفيذ التحجيم التلقائي لحساب التعلم الآلي. لمزيد من المعلومات، راجع إرشادات موثوقية التعلم الآلي في البنية الأساسية.

تتم معالجة مخاوف الموثوقية هذه في تصميم البنية الأساسية لمرجع الدردشة من طرف إلى طرف في Azure OpenAI الأساسي.

الأمان

ويوفر عامل الأمان ضمانات للحماية من الهجمات المتعمدة واستغلال البيانات والأنظمة القيمة الخاصة بك. لمزيد من المعلومات، راجع قائمة اختيار مراجعة التصميم للأمان.

يتناول هذا القسم بعض التوصيات الرئيسية التي تم تنفيذها في هذه البنية. تتضمن هذه التوصيات تصفية المحتوى ومراقبة إساءة استخدامه، وإدارة الهوية والوصول، وعناصر التحكم في الوصول المستندة إلى الأدوار. نظرا لأن هذه البنية غير مصممة لتوزيع الإنتاج، يناقش هذا القسم ميزة أمان رئيسية لم يتم تنفيذها في هذه البنية، أمان الشبكة.

تصفية المحتوى ومراقبة إساءة استخدامه

يتضمن Azure OpenAI نظام تصفية المحتوى الذي يستخدم مجموعة من نماذج التصنيف للكشف عن فئات معينة من المحتوى الذي يحتمل أن يكون ضارا ومنعها في كل من مطالبات الإدخال وإكمال الإخراج. وتشمل فئات هذا المحتوى الذي يحتمل أن يكون ضارا الكراهية والجنسية وإيذاء النفس والعنف والألفاظ النابية والهروب من السجن (المحتوى المصمم لتجاوز قيود نموذج اللغة). يمكنك تكوين صرامة ما تريد تصفيته من المحتوى لكل فئة، مع وجود خيارات منخفضة أو متوسطة أو عالية. تعتمد هذه البنية المرجعية نهجا صارما. اضبط الإعدادات وفقا لمتطلباتك.

بالإضافة إلى تصفية المحتوى، ينفذ Azure OpenAI ميزات مراقبة إساءة الاستخدام. مراقبة إساءة الاستخدام هي عملية غير متزامنة تكشف وتخفف من مثيلات المحتوى المتكرر أو السلوكيات التي تشير إلى استخدام الخدمة بطريقة قد تنتهك قواعد سلوك Azure OpenAI. يمكنك طلب استثناء من مراقبة إساءة الاستخدام والمراجعة البشرية إذا كانت بياناتك حساسة للغاية أو إذا كانت هناك سياسات داخلية أو لوائح قانونية قابلة للتطبيق تمنع معالجة البيانات للكشف عن إساءة الاستخدام.

إدارة الهوية والوصول

يوسع الإرشادات التالية إرشادات إدارة الهوية والوصول في أساس App Service. تستخدم هذه البنية الهويات المدارة المعينة من قبل النظام. يتم إنشاء هويات منفصلة للموارد التالية:

  • الذكاء الاصطناعي Studio Hub
  • الذكاء الاصطناعي مشروع Studio لتأليف التدفق وإدارته
  • نقاط النهاية عبر الإنترنت في التدفق المنشور إذا تم نشر التدفق إلى نقطة نهاية مدارة عبر الإنترنت

إذا اخترت استخدام الهويات المدارة المعينة من قبل المستخدم، فيجب عليك إنشاء هويات منفصلة لكل مورد من الموارد المذكورة أعلاه.

تهدف مشاريع Azure الذكاء الاصطناعي Studio إلى أن تكون معزولة عن بعضها البعض. للسماح لمشاريع متعددة بالكتابة إلى نفس حساب Azure Storage، ولكن مع الحفاظ على المشاريع معزولة، يتم تطبيق الشروط على تعيينات الأدوار الخاصة بها لتخزين الكائن الثنائي كبير الحجم. تمنح هذه الشروط حق الوصول إلى حاويات معينة فقط داخل حساب التخزين. إذا كنت تستخدم الهويات المدارة المعينة من قبل المستخدم، فستحتاج إلى اتباع نهج مماثل من أجل الحفاظ على أقل امتياز.

حاليا، تستخدم واجهة مستخدم الدردشة المفاتيح للاتصال بنقطة النهاية المدارة عبر الإنترنت المنشورة. يتم تخزين المفاتيح في Azure Key Vault. عند الانتقال إلى الإنتاج، يجب استخدام الهوية المدارة لمصادقة واجهة مستخدم الدردشة إلى نقطة النهاية المدارة عبر الإنترنت.

أدوار الوصول المستندة إلى الدور

يقوم النظام تلقائيا بإنشاء تعيينات الأدوار للهويات المدارة المعينة من قبل النظام. نظرا لأن النظام لا يعرف ميزات المركز والمشاريع التي قد تستخدمها، فإنه ينشئ تعيينات أدوار تدعم جميع الميزات المحتملة. على سبيل المثال، ينشئ النظام تعيين الدور "Storage File Data Privileged Contributor" إلى حساب التخزين ل Azure الذكاء الاصطناعي Studio. إذا كنت لا تستخدم تدفق المطالبة، فقد لا يتطلب حمل العمل هذا التعيين.

ملخص الأذونات الممنوحة تلقائيا للهويات المعينة من قبل النظام كما يلي:

الهوية Privilege Resource
الذكاء الاصطناعي Studio Hub read/write Key Vault
الذكاء الاصطناعي Studio Hub read/write تخزين Azure
الذكاء الاصطناعي Studio Hub read/write Azure Container Registry
مشروع الذكاء الاصطناعي Studio read/write Key Vault
مشروع الذكاء الاصطناعي Studio read/write تخزين Azure
مشروع الذكاء الاصطناعي Studio read/write Azure Container Registry
مشروع الذكاء الاصطناعي Studio write Application Insights
نقطة النهاية المدارة عبر الإنترنت read Azure Container Registry
نقطة النهاية المدارة عبر الإنترنت read/write تخزين Azure
نقطة النهاية المدارة عبر الإنترنت read الذكاء الاصطناعي Studio Hub (التكوينات)
نقطة النهاية المدارة عبر الإنترنت write مشروع الذكاء الاصطناعي Studio (مقاييس)

قد تكون تعيينات الدور التي تم إنشاؤها جيدة لمتطلبات الأمان الخاصة بك، أو قد ترغب في تقييدها. إذا كنت ترغب في اتباع مبدأ الامتياز الأقل وتقييد تعيينات الأدوار الخاصة بك إلى ما هو مطلوب فقط، فأنت بحاجة إلى إنشاء هويات مدارة معينة من قبل المستخدم وإنشاء تعيينات الأدوار المقيدة.

أمن الشبكة

لتسهيل تعلم كيفية إنشاء حل دردشة شامل، لا تنفذ هذه البنية أمان الشبكة. تستخدم هذه البنية الهوية كمحيطها وتستخدم بنيات السحابة العامة. يمكن الوصول إلى خدمات مثل Azure الذكاء الاصطناعي Search وAzure Key Vault وAzure OpenAI ونقطة النهاية المدارة عبر الإنترنت المنشورة وخدمة تطبيقات Azure من الإنترنت. تم تكوين جدار حماية Azure key vault للسماح بالوصول من جميع الشبكات. تضيف هذه التكوينات مساحة سطح إلى متجه الهجوم للبنية.

لمعرفة كيفية تضمين الشبكة كمحيط إضافي في البنية الخاصة بك، راجع قسم الشبكات في البنية الأساسية.

تحسين التكلفة

يركز تحسين التكلفة على البحث عن طرق للحد من النفقات غير الضرورية وتحسين الكفاءة التشغيلية. لمزيد من المعلومات، راجع قائمة اختيار مراجعة التصميم لتحسين التكلفة.

تم تصميم هذه البنية الأساسية للسماح لك بتقييم وتعلم كيفية إنشاء تطبيقات دردشة شاملة باستخدام Azure OpenAI. لا تمثل البنية تكاليف حل جاهز للإنتاج. علاوة على ذلك، لا تحتوي البنية على عناصر تحكم في مكانها للحماية من تجاوز التكلفة. يوضح التالي بعض الميزات الهامة التي تم حذفها في هذه البنية التي تؤثر على التكلفة:

  • تفترض هذه البنية أن هناك استدعاءات محدودة إلى Azure OpenAI. لهذا السبب، نقترح عليك استخدام تسعير الدفع أولا بأول وعدم توفير معدل النقل. أثناء الانتقال نحو حل إنتاج، اتبع إرشادات تحسين تكلفة Azure OpenAI في البنية الأساسية.

  • تم تكوين خطة خدمة التطبيق لطبقة التسعير الأساسية على مثيل واحد، والذي لا يوفر الحماية من انقطاع منطقة التوفر. توصي بنية App Service الأساسية باستخدام خطط Premium مع ثلاثة مثيلات عاملة أو أكثر لقابلية الوصول العالية التي تؤثر على التكلفة الخاصة بك.

  • لم يتم تكوين التحجيم للحساب المدار لنقطة النهاية عبر الإنترنت. بالنسبة إلى عمليات نشر الإنتاج، يجب تكوين التحجيم التلقائي. علاوة على ذلك، توصي بنية الدردشة الشاملة الأساسية بالنشر إلى Azure App Service في تكوين المنطقة المكررة. يؤثر كل من هذه التغييرات المعمارية على التكلفة عند الانتقال إلى الإنتاج.

  • تم تكوين Azure الذكاء الاصطناعي Search لطبقة التسعير الأساسية بدون نسخ متماثلة مضافة. تعذر على هذا المخطط تحمل فشل منطقة توفر Azure. توصي بنية الدردشة الأساسية الشاملة بالنشر مع مستوى التسعير القياسي أو أعلى ونشر ثلاث نسخ متماثلة أو أكثر، ما يؤثر على التكلفة الخاصة بك أثناء الانتقال نحو الإنتاج.

  • لا توجد ضوابط إدارة التكاليف أو الاحتواء في هذه البنية. تأكد من الحماية من العمليات غير المعالجة أو الاستخدام الذي قد يؤدي إلى تكاليف عالية لخدمات الدفع أولا بأول مثل Azure OpenAI.

التميز التشغيلي

يغطي التميز التشغيلي عمليات التشغيل التي تحافظ على تشغيل التطبيق في الإنتاج. لمزيد من المعلومات، راجع قائمة اختيار مراجعة التصميم للتميز التشغيلي.

الهويات المدارة المعينة من قبل النظام

تستخدم هذه البنية الهويات المدارة المعينة من قبل النظام ل Azure الذكاء الاصطناعي Studio (Hub) ومشاريع Azure الذكاء الاصطناعي Studio ونقطة النهاية المدارة عبر الإنترنت. يتم إنشاء هذه الهويات تلقائيا وتعيينها إلى الموارد. يقوم النظام تلقائيا بإنشاء تعيينات الدور المطلوبة لتشغيل النظام. ليست هناك حاجة لك لإدارة هذه الواجبات.

أوقات تشغيل تدفق المطالبة المضمنة

لتقليل الأعباء التشغيلية، تستخدم هذه البنية وقت التشغيل التلقائي، وهو خيار حساب بلا خادم ضمن التعلم الآلي يبسط إدارة الحوسبة ويفوض معظم تكوين تدفق المطالبة إلى ملف التطبيق requirements.txt قيد التشغيل وتكوينهflow.dag.yaml. وقت التشغيل التلقائي هو صيانة منخفضة وزائلة ومحركها التطبيق.

مراقبة‬

يتم تكوين التشخيصات لجميع الخدمات. يتم تكوين جميع الخدمات ولكن App Service لالتقاط جميع السجلات. تم تكوين App Service لالتقاط AppServiceHTTPLogs وAppServiceConsoleLogs وAppServiceAppLogs وAppServicePlatformLogs. أثناء مرحلة إثبات المفهوم، من المهم الحصول على فهم للسجلات والمقاييس المتاحة ليتم التقاطها. عند الانتقال إلى الإنتاج، يجب إزالة مصادر السجل التي لا تضيف قيمة وتضيف الضوضاء والتكلفة إلى متلقي سجل حمل العمل الخاص بك.

نوصيك أيضا بجمع البيانات من نقاط النهاية المدارة عبر الإنترنت المنشورة لتوفير إمكانية المراقبة للتدفقات المنشورة. عند اختيار جمع هذه البيانات، يتم تسجيل بيانات الاستدلال إلى Azure Blob Storage. يتم تسجيل كل من حمولات طلب HTTP والاستجابة. يمكنك أيضا اختيار تسجيل البيانات المخصصة.

تأكد من تمكين التكامل مع تشخيصات Application Insights لنقطة النهاية المدارة عبر الإنترنت. يتم إرسال المقاييس والسجلات المضمنة إلى Application Insights ويمكنك استخدام ميزات Application Insights لتحليل أداء نقاط النهاية الاستدلالية.

عمليات نموذج اللغة

نظرا لأن هذه البنية محسنة للتعلم وغير مخصصة لاستخدام الإنتاج، فإن التوجيه التشغيلي مثل GenAIOps خارج النطاق. عند الانتقال نحو الإنتاج، اتبع إرشادات عمليات نموذج اللغة في البنية الأساسية.

التطوير

يوفر تدفق المطالبة تجربة تأليف مستندة إلى المستعرض في Azure الذكاء الاصطناعي Studio أو من خلال ملحق Visual Studio Code. يخزن كلا الخيارين التعليمات البرمجية للتدفق كملفات. عند استخدام Azure الذكاء الاصطناعي Studio، يتم تخزين الملفات في ملفات في حساب تخزين. عند العمل في Microsoft Visual Studio Code، يتم تخزين الملفات في نظام الملفات المحلي.

نظرا لأن هذه البنية مخصصة للتعلم، فلا بأس من استخدام تجربة التأليف المستندة إلى المستعرض. عند البدء في الانتقال نحو الإنتاج، اتبع الإرشادات الواردة في البنية الأساسية حول أفضل ممارسات التطوير والتحكم بالمصادر.

نوصي باستخدام خيار الحوسبة بلا خادم عند تطوير واختبار تدفقات المطالبة في Azure الذكاء الاصطناعي Studio. هذا يمنعك من الاضطرار إلى نشر وإدارة مثيل حساب للتطوير والاختبار. إذا كنت بحاجة إلى بيئة مخصصة، يمكنك نشر مثيل حساب.

التقييم

تقييم كيفية إجراء توزيع نموذج Azure OpenAI من خلال تجربة مستخدم في Azure الذكاء الاصطناعي Studio. تقترح Microsoft أن تصبح على دراية بكيفية تقييم تطبيقات الذكاء الاصطناعي التوليدية لضمان تلبية اختيار النموذج لمتطلبات تصميم المستخدم وعبء العمل.

أداة تقييم مهمة للتعرف على نفسك في مراحل تطوير حمل العمل هي لوحات معلومات الذكاء الاصطناعي المسؤول في Azure التعلم الآلي. تساعدك هذه الأداة على تقييم الإنصاف وقابلية تفسير النموذج والتقييمات الرئيسية الأخرى للنشرات الخاصة بك وهي مفيدة في إنشاء أساس مبكر لمنع التراجعات المستقبلية.

التوزيع

تنفذ هذه البنية الأساسية مثيلا واحدا للمنسق المنشور. عند نشر التغييرات، يحل التوزيع الجديد محل التوزيع الحالي. عند البدء في الانتقال نحو الإنتاج، اقرأ تدفق النشر وإرشادات التوزيع في بنية الأساس للحصول على إرشادات حول فهم وتنفيذ نهج نشر أكثر تقدما مثل عمليات النشر الزرقاء/الخضراء.

كفاءة الأداء

كفاءة الأداء هي قدرة حمل عملك على تغيير الحجم لتلبية المطالب التي يضعها المستخدمون عليها بطريقة فعالة. لمزيد من المعلومات، راجع قائمة اختيار مراجعة التصميم لكفاءة الأداء.

نظرا لأن هذه البنية غير مصممة لتوزيع الإنتاج، يوضح التالي بعض ميزات كفاءة الأداء الهامة التي تم حذفها في هذه البنية، بالإضافة إلى التوصيات والاعتبارات الأخرى.

يجب أن تكون نتيجة إثبات المفهوم اختيار SKU الذي تقدره مناسبا لحمل العمل الخاص بك لكل من خدمة التطبيق حوسبة Azure التعلم الآلي. يجب عليك تصميم حمل العمل الخاص بك لتلبية الطلب بكفاءة من خلال التحجيم الأفقي. يسمح لك التحجيم الأفقي بضبط عدد مثيلات الحوسبة التي يتم نشرها في خطة خدمة التطبيق والمثيلات المنشورة خلف نقطة النهاية عبر الإنترنت. لا تصمم النظام ليعتمد على تغيير وحدة SKU للحساب لتتماشى مع الطلب.

  • تستخدم هذه البنية نموذج الاستهلاك أو الدفع أولا بأول لمعظم المكونات. نموذج الاستهلاك هو أفضل جهد وقد يكون عرضة لجيران صاخبة أو ضغوط أخرى على النظام الأساسي. أثناء الانتقال نحو الإنتاج، يجب تحديد ما إذا كان التطبيق الخاص بك يتطلب معدل نقل مخصصا يضمن سعة معالجة محجوزة لتوزيع نموذج Azure OpenAI. توفر السعة المحجوزة أداء ومعدل نقل يمكن التنبؤ به لنماذجك.

  • لا يتم تنفيذ التحجيم التلقائي لنقطة نهاية Azure التعلم الآلي عبر الإنترنت، لذا ستحتاج إلى توفير SKU وكمية المثيل التي يمكنها التعامل مع ذروة الحمل. الخدمة، كما تم تكوينها، لا تتوسع ديناميكيا للحفاظ على العرض متوافقا مع الطلب بكفاءة. أثناء الانتقال نحو الإنتاج، اتبع الإرشادات حول كيفية التحجيم التلقائي لنقطة نهاية عبر الإنترنت.

نشر هذا السيناريو

لنشر وتشغيل التنفيذ المرجعي، اتبع الخطوات الواردة في تنفيذ المرجع الأساسي من طرف إلى طرف في Azure OpenAI.

الخطوة التالية