إشعار
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تسجيل الدخول أو تغيير الدلائل.
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تغيير الدلائل.
تكمل هذه المقالة مهام سير عمل MLOps على Databricks عن طريق إضافة معلومات خاصة بسير عمل LLMOps. لمزيد من التفاصيل، راجع الكتاب الكبير من MLOps.
كيف يتغير سير عمل MLOps ل LLMs؟
LLMs هي فئة من نماذج معالجة اللغة الطبيعية (NLP) التي تجاوزت بشكل كبير أسلافها في الحجم والأداء عبر مجموعة متنوعة من المهام، مثل الإجابة على الأسئلة المفتوحة، والتلخيص، وتنفيذ التعليمات.
يختلف تطوير وتقييم LLMs في بعض الطرق الهامة عن نماذج التعلم الآلي التقليدية. يلخص هذا القسم بإيجاز بعض الخصائص الرئيسية ل LLMs والآثار المترتبة على MLOps.
| الخصائص الرئيسية ل LLMs | الآثار المترتبة على MLOps |
|---|---|
| تتوفر LLMs في العديد من الأشكال. - نماذج الملكية العامة وبرمجيات مفتوحة المصدر التي يتم الوصول إليها باستخدام واجهات برمجة التطبيقات المدفوعة. - نماذج مصدر مفتوح الجاهزة التي تختلف من تطبيقات عامة إلى تطبيقات محددة. - نماذج مخصصة تم ضبطها بدقة لتطبيقات معينة. - تطبيقات مخصصة مدربة مسبقا. |
عملية التطوير: غالبا ما تتطور المشاريع بشكل متزايد، بدءا من النماذج الحالية أو الجهات الخارجية أو مصدر مفتوح وتنتهي بنماذج مخصصة دقيقة. |
| تأخذ العديد من LLMs استعلامات اللغة الطبيعية العامة والإرشادات كمدخل. يمكن أن تحتوي هذه الاستعلامات على مطالبات مصممة بعناية للحصول على الاستجابات المطلوبة. | عملية التطوير: غالبا ما يكون تصميم قوالب نصية للاستعلام عن LLMs جزءا مهما من تطوير مسارات LLM جديدة. تغليف البيانات الاصطناعية ML: تستخدم العديد من مسارات LLM LLMs الحالية أو LLM التي تخدم نقاط النهاية. قد يركز منطق التعلم الآلي الذي تم تطويره لهذه المسارات على قوالب المطالبة أو العوامل أو السلاسل بدلا من النموذج نفسه. قد تكون أدوات التعلم الآلي المجمعة والمروجة للإنتاج هي هذه المسارات، بدلا من النماذج. |
| يمكن إعطاء العديد من LLMs مطالبات بأمثلة أو سياق أو معلومات أخرى للمساعدة في الإجابة على الاستعلام. | خدمة البنية الأساسية: عند زيادة استعلامات LLM مع السياق، قد تستخدم أدوات إضافية مثل قواعد بيانات المتجهات للبحث عن السياق ذي الصلة. |
| توفر واجهات برمجة التطبيقات التابعة لجهات خارجية نماذج خاصة ومفتوحة المصدر. | إدارة واجهة برمجة التطبيقات: يوفر استخدام حوكمة واجهة برمجة التطبيقات المركزية القدرة على التبديل بسهولة بين موفري واجهة برمجة التطبيقات. |
| تعد LLMs نماذج تعلم عميق كبيرة جدا، وغالبا ما تتراوح بين الجيجابايت ومئات الجيجابايت. | خدمة البنية الأساسية: قد تتطلب LLMs وحدات معالجة الرسومات لخدمة النموذج في الوقت الحقيقي، والتخزين السريع للنماذج التي تحتاج إلى تحميلها ديناميكيا. مفاضلات التكلفة/الأداء: نظرا لأن النماذج الأكبر تتطلب المزيد من الحساب وتكون أكثر تكلفة للخدمة، فقد تكون هناك حاجة إلى تقنيات لتقليل حجم النموذج والحساب. |
| يصعب تقييم LLMs باستخدام مقاييس التعلم الآلي التقليدية نظرا لعدم وجود إجابة "صحيحة" واحدة في كثير من الأحيان. | التعليقات البشرية: تعد التعليقات البشرية ضرورية لتقييم واختبار LLMs. يجب دمج ملاحظات المستخدم مباشرة في عملية MLOps، بما في ذلك الاختبار والمراقبة والضبط الدقيق في المستقبل. |
القواسم المشتركة بين MLOps و LLMOps
لا تتغير العديد من جوانب عمليات MLOps ل LLMs. على سبيل المثال، تنطبق الإرشادات التالية أيضا على LLMs:
- استخدم بيئات منفصلة للتطوير والتقسيم المرحلي والإنتاج.
- استخدم Git للتحكم في الإصدار.
- إدارة تطوير النموذج باستخدام MLflow، واستخدام النماذج في كتالوج Unity لإدارة دورة حياة النموذج.
- تخزين البيانات في بنية مستودع باستخدام جداول Delta.
- يجب ألا تتطلب البنية الأساسية الحالية ل CI/CD أي تغييرات.
- يبقى الهيكل المعياري ل MLOps كما هو، مع خطوط أنابيب للتضمين، وتدريب النموذج، واستدلال النموذج، وما إلى ذلك.
الرسومات التخطيطية للبنية المرجعية
يستخدم هذا القسم تطبيقين قائمين على LLM لتوضيح بعض التعديلات على البنية المرجعية ل MLOps التقليدية. توضح الرسومات التخطيطية بنية الإنتاج ل 1) تطبيق الجيل المعزز باسترداد (RAG) باستخدام واجهة برمجة تطبيقات تابعة لجهة خارجية، و2) تطبيق RAG باستخدام نموذج مستضاف ذاتيا مضبوط. يظهر كلا الرسمين التخطيطيين قاعدة بيانات متجهات اختيارية — يمكن استبدال هذا العنصر بالاستعلام مباشرة عن LLM من خلال نقطة نهاية خدمة النموذج.
RAG مع واجهة برمجة تطبيقات LLM لجهة خارجية
يوضح الرسم التخطيطي بنية إنتاج لتطبيق RAG يتصل بواجهة برمجة تطبيقات LLM لجهة خارجية باستخدام نماذج Databricks الخارجية.

RAG مع نموذج مصدر مفتوح مضبوط
يوضح الرسم التخطيطي بنية إنتاج لتطبيق RAG الذي يضبط نموذج مصدر مفتوح.

تغييرات LLMOps على بنية إنتاج MLOps
يسلط هذا القسم الضوء على التغييرات الرئيسية في البنية المرجعية MLOps لتطبيقات LLMOps.
مركز النموذج
غالبا ما تستخدم تطبيقات LLM نماذج موجودة مدربة مسبقا محددة من مركز نموذج داخلي أو خارجي. يمكن استخدام النموذج كما هو أو ضبطه بدقة.
يتضمن Databricks مجموعة مختارة من النماذج الأساسية عالية الجودة والمدربة مسبقا في كتالوج Unity وفي Databricks Marketplace. يمكنك استخدام هذه النماذج المدربة مسبقا للوصول إلى أحدث قدرات الذكاء الاصطناعي، ما يوفر لك الوقت والنفقات لبناء نماذج مخصصة خاصة بك. للحصول على التفاصيل، راجع النماذج المدربة مسبقا في كتالوج Unity و Marketplace.
قاعدة بيانات المتجهات
تستخدم بعض تطبيقات LLM قواعد بيانات المتجهات لعمليات البحث عن التشابه السريع، على سبيل المثال لتوفير معرفة السياق أو المجال في استعلامات LLM. يوفر Databricks وظيفة بحث متجه متكاملة تتيح لك استخدام أي جدول Delta في كتالوج Unity كقاعدة بيانات متجهة. تتم مزامنة فهرس البحث المتجه تلقائيا مع جدول Delta. للحصول على التفاصيل، راجع البحث في المتجهات.
يمكنك إنشاء أداة نموذج تغلف المنطق لاسترداد المعلومات من قاعدة بيانات متجهة وتوفر البيانات التي تم إرجاعها بسياق إلى LLM. يمكنك بعد ذلك تسجيل النموذج باستخدام نكهة نموذج MLflow LangChain أو PyFunc.
ضبط LLM
نظرا لأن نماذج LLM مكلفة وتستغرق وقتا طويلا لإنشاءها من البداية، غالبا ما تقوم تطبيقات LLM بضبط نموذج موجود لتحسين أدائه في سيناريو معين. في البنية المرجعية، يتم تمثيل الضبط الدقيق ونشر النموذج كوظائف Databricks مميزة. غالبا ما يكون التحقق من صحة نموذج مضبوط قبل النشر عملية يدوية.
يوفر Databricks ضبطا دقيقا لنموذج الأساس، مما يتيح لك استخدام بياناتك الخاصة لتخصيص LLM موجود لتحسين أدائه لتطبيقك المحدد. للحصول على التفاصيل، راجع ضبط نموذج الأساس.
خدمة النموذج
في RAG باستخدام سيناريو واجهة برمجة تطبيقات تابعة لجهة خارجية، هناك تغيير معماري مهم وهو أن البنية الأساسية لبرنامج ربط العمليات التجارية LLM تقوم بإجراء استدعاءات API خارجية، من نقطة نهاية خدمة النموذج إلى واجهات برمجة تطبيقات LLM الداخلية أو الخارجية. وهذا يضيف التعقيد وزمن الانتقال المحتمل وإدارة بيانات الاعتماد الإضافية.
يوفر Databricks خدمة نموذج الذكاء الاصطناعي الفسيفساء، والتي توفر واجهة موحدة لنشر نماذج الذكاء الاصطناعي والتحكم فيها والاستعلام عنها. للحصول على التفاصيل، راجع الفسيفساء الذكاء الاصطناعي خدمة النموذج.
التعليقات البشرية في المراقبة والتقييم
تعد حلقات الملاحظات البشرية ضرورية في معظم تطبيقات LLM. يجب إدارة التعليقات البشرية مثل البيانات الأخرى، بشكل مثالي دمجها في المراقبة بناء على الدفق في الوقت الفعلي تقريبا.
يساعدك تطبيق مراجعة إطار عمل العامل الذكاء الاصطناعي الفسيفساء على جمع الملاحظات من المراجعين البشريين. للحصول على التفاصيل، راجع الحصول على ملاحظات حول جودة تطبيق عاملي.