ما هو إطار عمل عامل الذكاء الاصطناعي الفسيفساء؟

هام

هذه الميزة في المعاينة العامة.

يتضمن إطار عمل العامل مجموعة من الأدوات على Databricks المصممة لمساعدة المطورين على بناء وتوزيع وتقييم عوامل جودة الإنتاج مثل تطبيقات Retrieval Augmented Generation (RAG).

تتناول هذه المقالة ما هو إطار عمل العامل وفوائد تطوير تطبيقات RAG على Azure Databricks.

رسم تخطيطي LLMOps مبسط

يسمح إطار عمل العامل للمطورين بالتكرار بسرعة على جميع جوانب تطوير RAG باستخدام سير عمل LLMOps من طرف إلى طرف.

المتطلبات

  • يجب تمكين ميزات Azure الذكاء الاصطناعي Services الذكاء الاصطناعي المساعدة لمساحة العمل الخاصة بك.
  • يجب أن تكون جميع مكونات تطبيق عامل في مساحة عمل واحدة. على سبيل المثال، في حالة تطبيق RAG، يجب أن يكون نموذج الخدمة ومثيل البحث المتجه في نفس مساحة العمل.

تطوير RAG على مستوى الإنتاج

التكرار بسرعة على تطوير العامل باستخدام الميزات التالية:

إنشاء وتسجيل العوامل باستخدام أي مكتبة وMLflow. قم بوضع معلمات لوكلاءك للتجربة والتكرار على تطوير العامل بسرعة.

انشر العوامل في الإنتاج مع الدعم الأصلي لتدفق الرمز المميز وتسجيل الطلب/الاستجابة، بالإضافة إلى تطبيق مراجعة مضمن للحصول على ملاحظات المستخدم لوكيلك.

يتيح لك تتبع العامل تسجيل التتبعات وتحليلها ومقارنتها عبر التعليمات البرمجية للعامل لتصحيح وفهم كيفية استجابة وكيلك للطلبات.

تقييم عامل الذكاء الاصطناعي الفسيفساء

يتضمن إطار عمل العامل تقييم وكيل بمساعدة الذكاء الاصطناعي لمساعدة المطورين على تقييم جودة تطبيقات الذكاء الاصطناعي التوليدية وتكلفتها وزمن انتقالها. يشمل تقييم العامل الميزات التالية:

  • استخدم تطبيق المراجعة لجمع الملاحظات من المساهمين الخبراء في تطبيقك. يساعد المراجعون الخبراء على ضمان جودة إجابات تطبيق RAG وسلامتها.
  • استخدم قضاة LLM الخاصين ومقاييس الوكيل لتقييم جودة الاسترداد والطلب بالإضافة إلى مقاييس الأداء الإجمالية مثل زمن الانتقال وتكلفة الرمز المميز.

ما هو RAG؟

RAG هي تقنية تصميم الذكاء الاصطناعي توليدية تعزز نماذج اللغة الكبيرة (LLM) مع المعرفة الخارجية. تعمل هذه التقنية على تحسين LLMs بالطرق التالية:

  • المعرفة الخاصة: يمكن أن تتضمن RAG معلومات خاصة لم يتم استخدامها في البداية لتدريب LLM، مثل المذكرات ورسائل البريد الإلكتروني والمستندات للإجابة على الأسئلة الخاصة بالمجال.
  • معلومات محدثة: يمكن لتطبيق RAG تزويد LLM بمعلومات من مصادر البيانات المحدثة.
  • نقل المصادر: تمكن RAG LLMs من اقتباس مصادر محددة، مما يسمح للمستخدمين بالتحقق من الدقة الواقعية للردود.
  • قوائم أمان البيانات والتحكم في الوصول (ACL): يمكن تصميم خطوة الاسترداد لاسترداد المعلومات الشخصية أو الخاصة بشكل انتقائي استنادا إلى بيانات اعتماد المستخدم.

أنظمة الذكاء الاصطناعي المركبة

تطبيق RAG هو مثال على نظام الذكاء الاصطناعي مركب: فهو يتوسع في قدرات اللغة ل LLM من خلال الجمع بينه والأدوات والإجراءات الأخرى.

في أبسط شكل، يقوم تطبيق RAG بتنفيذ ما يلي:

  1. الاسترداد: يتم استخدام طلب المستخدم للاستعلام عن مخزن بيانات خارجي، مثل مخزن متجهات أو بحث عن كلمة أساسية نصية أو قاعدة بيانات SQL. الهدف هو الحصول على بيانات داعمة لاستجابة LLM.
  2. الزيادة: يتم دمج البيانات المستردة مع طلب المستخدم، وغالبا ما تستخدم قالب بتنسيق وإرشادات إضافية، لإنشاء مطالبة.
  3. Generation: يتم تمرير المطالبة إلى LLM، والذي يقوم بعد ذلك بإنشاء استجابة للاستعلام.

حالات استخدام الذكاء الاصطناعي RAG وgen

يسرد الجدول التالي بعض حالات استخدام RAG.

حالة الاستخدام ‏‏الوصف
روبوتات الدردشة Q&A استخدم LLMs مع روبوتات الدردشة لاشتقاق إجابات دقيقة من مستندات الشركة قاعدة المعارف (KB). يمكن أن تقوم روبوتات الدردشة بأتمتة دعم العملاء ومتابعة عملاء موقع الويب للإجابة على الأسئلة بسرعة وحل المشكلات.
زيادة البحث استخدم LLMs مع محركات البحث لزيادة نتائج البحث باستخدام إجابات تم إنشاؤها بواسطة LLM، مما يسهل على المستخدمين العثور على المعلومات التي يحتاجونها.
محرك المعرفة استخدم بيانات الشركة، مثل الموارد البشرية ومستندات التوافق، كسياق ل LLMs للسماح للموظفين بالحصول بسهولة على إجابات للأسئلة حول المزايا والسياسات والأمان والتوافق.

بيانات RAG غير منظمة البنية مقابل بيانات RAG المنظمة

يمكن أن تعمل بنية RAG مع البيانات الداعمة غير المنظمة أو المنظمة. تعتمد البيانات التي تستخدمها مع RAG على حالة الاستخدام الخاصة بك.

بيانات غير منظمة: بيانات بدون بنية أو مؤسسة محددة. المستندات التي تتضمن نصا وصورا أو محتوى وسائط متعددة مثل الصوت أو مقاطع الفيديو.

  • ملفات PDF
  • مستندات Google/Office
  • Wikis
  • الصور
  • ملفات الفيديو

البيانات المنظمة: البيانات الجدولية المرتبة في صفوف وأعمدة ذات مخطط معين، مثل الجداول في قاعدة بيانات.

  • سجلات العملاء في نظام BI أو Data Warehouse
  • بيانات المعاملة من قاعدة بيانات SQL
  • البيانات من واجهات برمجة التطبيقات للتطبيق (مثل SAP وSalesforce وما إلى ذلك)

تصف الأقسام التالية تطبيق RAG للبيانات غير المنظمة.

مسار بيانات RAG

يقوم مسار بيانات RAG بمعالجة المستندات مسبقا وفهرستها للاسترداد السريع والدقيق.

يوضح الرسم التخطيطي أدناه نموذج مسار بيانات لمجموعة بيانات غير منظمة باستخدام خوارزمية بحث دلالية. تنسق مهام سير عمل Databricks كل خطوة.

مسار بيانات RAG

  1. استيعاب البيانات - استيعاب البيانات من مصدر الملكية الخاص بك. قم بتخزين هذه البيانات في جدول Delta أو وحدة تخزين كتالوج Unity.
  2. معالجة المستندات: يمكنك تنفيذ هذه المهام باستخدام مهام سير عمل Databricks ودفاتر ملاحظات Databricks وجداول Delta Live.
    • توزيع المستندات الأولية: تحويل البيانات الأولية إلى تنسيق قابل للاستخدام. على سبيل المثال، استخراج النص والجداول والصور من مجموعة من ملفات PDF أو استخدام تقنيات التعرف البصري على الأحرف لاستخراج النص من الصور.
    • استخراج بيانات التعريف: استخراج بيانات تعريف المستند مثل عناوين المستندات وأرقام الصفحات وعناوين URL للمساعدة في استعلام خطوة الاسترداد بشكل أكثر دقة.
    • مستندات المجموعة: تقسيم البيانات إلى مجموعات تتناسب مع نافذة سياق LLM. يؤدي استرداد هذه المجموعات المركز عليها، بدلا من المستندات بأكملها، إلى منح LLM محتوى أكثر استهدافا لإنشاء استجابات.
  3. تضمين المجموعات - يستهلك نموذج التضمين المجموعات لإنشاء تمثيلات رقمية للمعلومات التي تسمى تضمينات المتجهات. تمثل المتجهات المعنى الدلالي للنص، وليس فقط الكلمات الأساسية على مستوى السطح. في هذا السيناريو، يمكنك حساب التضمينات واستخدام خدمة النموذج لخدمة نموذج التضمين.
  4. تخزين التضمين - قم بتخزين تضمينات المتجه ونص المجموعة في جدول Delta تمت مزامنته مع Vector Search.
  5. قاعدة بيانات المتجهات - كجزء من "البحث عن المتجهات"، تتم فهرسة عمليات التضمين وبيانات التعريف وتخزينها في قاعدة بيانات متجهة للاستعلام بسهولة من قبل عامل RAG. عندما يقوم مستخدم بإجراء استعلام، يتم تضمين طلبه في متجه. ثم تستخدم قاعدة البيانات فهرس المتجه للعثور على المجموعات الأكثر مشابهة وإرجاعها.

تتضمن كل خطوة قرارات هندسية تؤثر على جودة تطبيق RAG. على سبيل المثال، يضمن اختيار حجم المجموعة الصحيح في الخطوة (3) تلقي LLM معلومات محددة ولكنها سياقية، بينما تحديد نموذج تضمين مناسب في الخطوة (4) يحدد دقة المجموعات التي تم إرجاعها أثناء الاسترداد.

غالبا ما يكون تشابه الحوسبة مكلفا حسابيا، ولكن فهارس المتجهات مثل Databricks Vector Search تحسن هذا من خلال تنظيم التضمينات بكفاءة. تقوم عمليات البحث المتجهة بترتيب النتائج الأكثر صلة بسرعة دون مقارنة كل تضمين باستعلام المستخدم بشكل فردي.

يقوم Vector Search تلقائيا بمزامنة عمليات التضمين الجديدة المضافة إلى جدول Delta وتحديث فهرس Vector Search.

ما هو وكيل RAG؟

يعد عامل Retrieval Augmented Generation (RAG) جزءا أساسيا من تطبيق RAG الذي يعزز قدرات نماذج اللغات الكبيرة (LLMs) من خلال دمج استرداد البيانات الخارجية. يعالج عامل RAG استعلامات المستخدم، ويسترد البيانات ذات الصلة من قاعدة بيانات متجهة، ويمرر هذه البيانات إلى LLM لإنشاء استجابة.

ترتبط أدوات مثل LangChain أو Pyfunc بهذه الخطوات عن طريق توصيل مدخلاتها ومخرجاتها.

يوضح الرسم التخطيطي أدناه عامل RAG لروبوت الدردشة وميزات Databricks المستخدمة لإنشاء كل عامل.

سير عمل بنية روبوت الدردشة RAG

  1. المعالجة المسبقة للاستعلام - يرسل المستخدم استعلاما، ثم تتم معالجته مسبقا لجعله مناسبا للاستعلام عن قاعدة بيانات المتجهات. قد يتضمن ذلك وضع الطلب في قالب أو استخراج الكلمات الأساسية.
  2. تحويل الاستعلام - استخدم Model Serving لتضمين الطلب باستخدام نفس نموذج التضمين المستخدم لتضمين المجموعات في مسار البيانات. تتيح هذه التضمينات مقارنة التشابه الدلالي بين الطلب والأجزاء المعالجة مسبقا.
  3. مرحلة الاسترداد - يأخذ المسترد، وهو تطبيق مسؤول عن جلب المعلومات ذات الصلة، الاستعلام المتجه وينفذ بحث تشابه متجه باستخدام Vector Search. يتم تصنيف مجموعات البيانات الأكثر صلة واستردادها استنادا إلى تشابهها مع الاستعلام.
  4. زيادة المطالبة - يجمع المسترد بين مجموعات البيانات المستردة والاستعلام الأصلي لتوفير سياق إضافي ل LLM. يتم تنظيم المطالبة بعناية للتأكد من أن LLM يفهم سياق الاستعلام. غالبا ما يكون لدى LLM قالب لتنسيق الاستجابة. تعرف عملية ضبط المطالبة هذه باسم هندسة المطالبة.
  5. مرحلة إنشاء LLM - ينشئ LLM استجابة باستخدام الاستعلام المعزز الذي تم إثرائه من خلال نتائج الاسترداد. يمكن أن يكون LLM نموذجا مخصصا أو نموذجا تأسيسيا.
  6. ما بعد المعالجة - قد تتم معالجة استجابة LLM لتطبيق منطق عمل إضافي أو إضافة اقتباسات أو تحسين النص الذي تم إنشاؤه استنادا إلى قواعد أو قيود محددة مسبقا

يمكن تطبيق معايير حماية مختلفة خلال هذه العملية لضمان الامتثال لسياسات المؤسسة. قد يتضمن ذلك تصفية الطلبات المناسبة، والتحقق من أذونات المستخدم قبل الوصول إلى مصادر البيانات، واستخدام تقنيات con وضع الخيمة ration على الاستجابات التي تم إنشاؤها.

التقييم والمراقبة

يساعد التقييم والمراقبة في تحديد ما إذا كان تطبيق RAG يلبي متطلبات الجودة والتكلفة وزمن الانتقال. يحدث التقييم أثناء التطوير، بينما تحدث المراقبة بمجرد نشر التطبيق في الإنتاج.

تحتوي RAG على البيانات غير المنظمة على العديد من المكونات التي تؤثر على الجودة. على سبيل المثال، يمكن أن تؤثر تغييرات تنسيق البيانات على المجموعات المستردة وقدرة LLM على إنشاء استجابات ذات صلة. لذلك، من المهم تقييم المكونات الفردية بالإضافة إلى التطبيق الكلي.

لمزيد من المعلومات، راجع مقدمة إلى تقييم عامل الفسيفساء الذكاء الاصطناعي.

توافر المناطق

تتوفر الميزات التي تدعم تطوير تطبيق RAG وتشغيل تقييم العامل على Databricks المناطق التالية:

لمزيد من المعلومات حول التوفر الإقليمي، راجع الميزات ذات التوفر الإقليمي المحدود