סיכום
במודול זה למדת כיצד לאופטם ביצועי מודלים גנרטיביים של בינה מלאכותית באמצעות אסטרטגיות משלימות ב-Microsoft Foundry.
למדת כיצד:
- יישמו טכניקות הנדסת פרומפט כולל הודעות מערכת, למידת מספר קטן ופרמטרי מודל כדי לאופטימיזציה של פלט המודל.
- להבין מתי ואיך לקרקע מודל שפה באמצעות Retrieval Augmented Generation (RAG).
- זהה מתי כיוונון עדין של מודל משפר את העקביות ההתנהגותית.
- השווה אסטרטגיות אופטימיזציה וקבע מתי לשלב אותן.
המסקנה המרכזית היא שהנדסת פרומפט, RAG ו-fine-tuning אינן גישות מתחרות—הן אסטרטגיות משלימות שמטפלות בממדים שונים של ביצועי המודלים. התחילו בהנדסת הנחיה כדי להנחות את התנהגות המודל, הוסיפו RAG כאשר דיוק עובדתי דורש נתונים ספציפיים לתחום, ושקול כיוונון עדין כשצריך סגנון ופורמט עקביים שהנדסת פרומפט לבדה לא יכולה להשיג באופן אמין.
בתרחיש סוכנות הנסיעות, הפתרון היעיל ביותר עשוי לשלב את שלושתם: מודל מכוון היטב ששומר על קול המותג, RAG שממקם תגובות בקטלוג המלון עצמו, והנדסה מהירה שמוסיפה הוראות ספציפיות לשיחה ומעקות בטיחות.