تحسين مخرجات النموذج باستخدام هندسة الأوامر

مكتمل

نصيحة

راجع علامة التبويب النص والصور لمزيد من التفاصيل!

أكثر الطرق سهولة لتحسين أداء النموذج هي من خلال هندسة التوجيه. هندسة الأوامر هي عملية تصميم وتحسين المحفزات لتحسين جودة ودقة وملاءمة الردود التي يولدها نموذج اللغة. لا يتطلب بنية تحتية إضافية أو بيانات تدريب، ويمكنك البدء في التجربة فورا.

فهم مكونات الأوامر

عندما تتفاعل مع نموذج لغوي، تؤثر جودة سؤالك بشكل مباشر على جودة الإجابة. الموضوع المصمم جيدا يساعد النموذج على فهم ما تحتاجه وتوليد إجابة أكثر فائدة.

عادة ما تتضمن المحفزات لنماذج إكمال المحادثة المكونات التالية:

  • رسالة النظام: تعليمات تحدد سلوك النموذج ودوره وقيوده.
  • رسالة المستخدم: السؤال أو المدخلات من المستخدم.
  • رسالة المساعد: ردود النماذج السابقة، المستخدمة في المحادثات متعددة الأدوار.
  • أمثلة: أزواج إدخال/إخراج عينات تظهر تنسيق الاستجابة المتوقع.

كيفية هيكلتك ودمج هذه المكونات تحدد مدى فعالية استجابة النموذج.

تصميم رسائل نظام فعالة

رسالة النظام هي مجموعة من التعليمات التي تقدمها للنموذج لتوجيه استجاباته. عادة ما تظهر رسائل النظام أولا في المحادثة وتعمل كأعلى مجموعة تعليمات على المستوى. تستخدمها ل:

  • حدد دور المساعد وحدوده.
  • حدد النغمة وأسلوب التواصل.
  • حدد تنسيقات الإخراج، مثل JSON أو نقاط الرصاص.
  • أضف قيود السلامة والجودة لوضعك.

يمكن أن تكون رسالة النظام بسيطة مثل:

You are a helpful AI assistant.

أو يمكن أن يتضمن قواعد تفصيلية ومتطلبات تنسيق. على سبيل المثال، يمكن لتطبيق الدردشة الخاص بوكالة السفر أن يستخدم:

You are a friendly travel advisor for Margie's Travel.
Answer only questions related to travel, hotels, and trip planning.
Use a warm, conversational tone.
If you don't have enough information to answer, ask a clarifying question.
Format hotel recommendations as a bulleted list with the hotel name, location, and price range.

مهم

رسالة النظام تؤثر على النموذج لكنها لا تضمن الامتثال. يجب عليك اختبار وتكرار رسائل نظامك، وطبقتها مع وسائل تخفيف أخرى مثل تصفية المحتوى وتقييمه.

عند تصميم رسالة نظام، اتبع هذه القائمة المرجعية:

  1. ابدأ بدور المساعد: اذكر الدور والنتيجة المتوقعة لطلب نموذجي.
  2. حدد حدودا: قم بإدراج المواضيع والإجراءات وأنواع المحتوى التي يجب على المساعد تجنبها.
  3. حدد تنسيق الإخراج: إذا كنت بحاجة إلى تنسيق معين، اذكره بوضوح وحافظ على اتساقه.
  4. أضف سياسة "عندما يكون غير متأكد": أخبر النموذج بما to do عندما يكون طلب المستخدم غامضا، خارج نطاق المعلومات، أو عندما يفتقر النموذج إلى المعلومات.

تطبيق أنماط الأوامر

تستخدم المحفزات الفعالة أنماطا تساعد النموذج على إنتاج ردود أفضل. إليك بعض الأنماط الشائعة التي يمكنك استخدامها:

نمط بيرسونا

وجه النموذج ليتخذ منظورا أو دورا محددا. على سبيل المثال، طلب الرد من النموذج كمحترف تسويق متمرس ينتج نتائج مختلفة عن عدم استخدام أي شخصية على الإطلاق.

لا شخصية مع بيرسونا
رسالة النظام بلا أنت محترف تسويق متمرس تكتب للعملاء التقنيين.
مطالبة المستخدم اكتب وصفا من جملة واحدة لمنتج CRM. اكتب وصفا من جملة واحدة لمنتج CRM.
Response منتج إدارة علاقات العملاء هو أداة برمجية مصممة لإدارة تفاعلات الشركة مع العملاء. اختبر إدارة علاقات العملاء السلسة مع نظام CRM الخاص بنا، المصمم لتبسيط العمليات ودفع نمو المبيعات من خلال تحليلات قوية.

نمط قالب التنسيق

قدم نموذجا أو هيكلا في المحفز للحصول على مخرج بصيغة محددة. على سبيل المثال، إذا كنت بحاجة إلى رد منظم حول فندق:

Format the result to show:
- Hotel name
- Location
- Star rating
- Price range per night

يضمن هذا النمط ردودا متسقة ومنظمة يسهل فهمها في طلبك.

نمط سلسلة الأفكار

اطلب من النموذج شرح تفكيره خطوة بخطوة. تسمى هذه التقنية، التي تسمى سلسلة التفكير، تقلل من احتمالية حدوث نتائج غير دقيقة وتجعل من السهل التحقق من منطق النموذج.

على سبيل المثال، بدلا من سؤال "أي فندق هو الأفضل لعائلة مكونة من أربعة أفراد؟"، يمكنك أن تسأل:

Which hotel is best for a family of four? Take a step-by-step approach: 
consider room size, amenities for children, location, and price.

تقنية ذات صلة هي تقسيم المهمة إلى خطوات فرعية صريحة قبل أن يرد النموذج، بدلا من طلب منه أن يشرح كل شيء دفعة واحدة. على سبيل المثال، قد تطلب أولا من النموذج استخراج حقائق رئيسية من مقطع، ثم في طلب متابعة تطلب منه الإجابة على سؤال بناء على تلك الحقائق. تفكيك العمل بهذه الطريقة يقلل من الأخطاء في المهام المعقدة متعددة الأجزاء.

‏‫ملاحظة‬

تحفيز سلسلة التفكير هو تقنية للنماذج غير المنطقية. نماذج الاستدلال مثل نماذج سلسلة o تتعامل مع المنطق خطوة بخطوة داخليا.

نمط التعلم بقليل الطلقات

قدم مثالا أو أكثر للمدخلات والمخرجات المطلوبة لمساعدة النموذج على تحديد النمط الذي تريده. تسمى هذه التقنية التعلم بعدة طلقات (أو الضربة الواحدة كمثال واحد). عندما لا تقدم أمثلة، يسمى ذلك التعلم الصفري.

على سبيل المثال، لتصنيف استفسارات العملاء:

Classify the following customer messages:

Message: "I need to change my flight to Rome"
Category: Booking change

Message: "What's the weather like in Bali in March?"
Category: Travel information

Message: "Can I get a refund for my cancelled tour?"
Category:

يتعلم النموذج نمط التصنيف من الأمثلة ويكمل الإدخال الأخير بشكل صحيح.

استخدم بناء جملة واضح ومحددات

عندما يتضمن التوجيه عدة أقسام — مثل التعليمات، نص المصدر، والأمثلة — استخدم محددات مثل ---، عناوين Markdown، أو علامات XML لفصلها. تساعد الحدود الواضحة النموذج على التمييز بين التعليمات والمحتوى وتقليل فرص سوء التفسير.

نصيحة

يمكن أن تكون النماذج عرضة لتحيز الحداثة، مما يعني أن النص الموجود في نهاية المحفز يمكن أن يكون له تأثير أكبر من النص في البداية. إذا لم يتبع النموذج تعليماتك باستمرار، حاول تكرار التعليمات الرئيسية في نهاية التوجيه.

تكوين معلمات النموذج

بعيدا عن نص المحفزات، يمكنك تعديل معلمات النموذج التي تتحكم في كيفية توليد النموذج للردود:

  • درجة الحرارة: تتحكم في عشوائية المخرج. القيمة الأعلى (على سبيل المثال، 0.7) تنتج ردودا أكثر إبداعا وتنوعا، بينما القيمة الأقل (على سبيل المثال، 0.2) تنتج استجابات أكثر تركيزا وحتمية. استخدم القيم الأقل للمهام الواقعية والقيم الأعلى للمهام الإبداعية.
  • Top_p: يتحكم أيضا في العشوائية، لكن بطريقة مختلفة. يحد النموذج إلى مجموعة فرعية من أكثر الرموز التالية احتمالا. على سبيل المثال، الرقم top_p 0.9 يعني أن النموذج يأخذ فقط في الاعتبار أفضل 90% من الرموز المحتملة.

نصيحة

التوصية العامة هي تعديل إما درجة الحرارة أو top_p، وليس كلاهما في نفس الوقت.

في سيناريو وكالة السفر، قد تستخدم درجة حرارة منخفضة (0.2) عند الإجابة على أسئلة واقعية حول مرافق الفندق، ودرجة حرارة أعلى (0.7) عند تقديم اقتراحات إبداعية لجدول السفر.

عندما تكون الهندسة السريعة كافية

هندسة الأوامر هي نقطة البداية الصحيحة لأي جهد لتحسين النماذج. يكون فعالا عندما تحتاج إلى:

  • وجه نبرة النموذج وشكلها وسلوكه.
  • قدم تعليمات محددة لمهمة.
  • قم بتحديث النتائج بسرعة دون تغييرات في البنية التحتية.
  • حافظ على انخفاض التكاليف، حيث لا يتطلب الأمر تدريبا إضافيا أو storage بيانات.

ومع ذلك، فإن هندسة الأوامر لها حدود. إذا لم يكن لدى النموذج access إلى المعلومات التي يحتاجها (مثل كتالوج فندق شركتك)، أو إذا فشل باستمرار في الحفاظ على سلوك معين رغم التعليمات التفصيلية، عليك التفكير في استراتيجيات إضافية.