יצירת ערכת בדיקת תגובה יחידה

הערכת תגובה יחידה בודקת את הסוכן שלך על שאלה אחת שלא התחברה בו-זמנית, במקום שיחה מלאה. לדוגמה, הערכת תגובה יחידה עבור סוכן שירות לקוחות שואלת מהן שעות העבודה שלך ?, מתעדת את תגובת הסוכן לשאלה זו ולאחר מכן מתחילה בשאלה חדשה, כיצד אוכל למצוא את היסטוריית ההזמנות שלי?

הערכות תגובה בודדות טובות כאשר ברצונך לבדוק את הסוכן שלך לגבי האופן שבו הוא עונה על שאלות ספציפיות, על היכולות שהוא קורא, ועל הנוצות המדויקות שבהן הוא משתמש בתשובות שלו. באפשרותך גם להפעיל הערכת שיחות, המאפשרת לך להעריך את אופן הפעולה של הסוכן שלך במהלך אינטראקציה ארוכה יותר.

הערכות משתמשות בערכות בדיקה. ערכת בדיקה עבור הערכות תגובה בודדות מורכבת מקבוצה של עד 100 מקרי בדיקה. בעת הפעלת הערכת הסוכן, אתה בוחר ערכת בדיקה ו-Copilot Studio מפעילה כל מקרה בדיקה בקבוצה זו מול הסוכן שלך.

ניתן ליצור מקרי בדיקה בתוך ערכת בדיקה באופן ידני, לייבא אותם באמצעות גיליון אלקטרוני, או להשתמש בבינה מלאכותית כדי ליצור הודעות בהתבסס על העיצוב והמשאבים של הסוכן שלך. לאחר מכן תוכל לבחור כיצד ברצונך למדוד את איכות התגובות של הסוכן שלך עבור כל מקרה בדיקה בתוך ערכת בדיקה.

לקבלת מידע נוסף על אופן הפעולה של הערכת סוכן, ראה אודות הערכת סוכן.

כדי ללמוד כיצד לערוך ערכת בדיקה קיימת, ראה שינוי הפרטים של ערכת בדיקה.

חשוב

תוצאות הבדיקה זמינות ב- Copilot Studio 89 ימים. כדי לשמור את תוצאות הבדיקה לפרק זמן ארוך יותר, יצא את התוצאות לקובץ CSV.

יצירת ערכת בדיקה חדשה

  1. עבור אל דף ההערכה של הסוכן שלך.

    צילום מסך שמראה כיצד לבחור את לשונית הערכה כאשר הבחירה בלשונית נדחסת עקב גודל המסך.

  2. בחר הערכה חדשה ולאחר מכן בחר תגובה בודדת.

    צילום מסך המציג את לחצן 'צור בדיקה חדשה' בדף 'הערכה'.

  3. בחר את השיטה שבה ברצונך להשתמש כדי ליצור את ערכת הבדיקה. ערכת בדיקה יכולה לכלול עד 100 מקרי בדיקה.

    • שאלות מהירה כדי ש- Copilot Studio ייצור מפרטי בדיקה באופן אוטומטי בהתבסס על התיאור, ההוראות והיכולות של הסוכן שלך. אפשרות זו מייצרת 10 שאלות עבור הפעלת הערכות קטנות ומהירות או כדי להתחיל לבנות ערכת בדיקה גדולה יותר.
    • ערכת שאלות של כדי ש- Copilot Studio ייצור מקרי בדיקה באמצעות מקור ידע או נושאים ובחר את מספר השאלות שיש להפיק.
    • השתמש בשיחות הצ'אט לבדיקה כדי לאכלס באופן אוטומטי את ערכת הבדיקה בשאלות שסיפקת בצ'אט הבדיקה. שיטה זו משתמשת בשאלות מתוך צ'אט הבדיקה העדכני ביותר. באפשרותך גם להתחיל הערכה מתוך צ'אט הבדיקה באמצעות לחצן ההערכה . צילום מסך המציג את לחצן 'צור בדיקה חדשה' בצ'אט הבדיקה.
    • יבא מקרי בדיקה מקובץ על-ידי גרירת הקובץ לאזור המיועד, בחירה באפשרות עיון כדי להעלות קובץ או בחירת אחת מאפשרויות ההעלאה האחרות.
    • לחלופין, כתוב כמה שאלות בעצמך כדי ליצור ערכת בדיקה באופן ידני. בצע את השלבים לעריכת ערכת בדיקה להוספה ולעריכה של מקרי בדיקה.
    • השתמש בנתוני ייצור בערכות נושא מהניתוח של הסוכן שלך. צילום מסך המציג את האפשרות 'הערכה' עבור ערכת נושא ברשימה 'ערכות נושא' עבור ערכת נושא אחת.
  4. תחת שם, הזן שם עבור ערכת הבדיקה.

  5. שנה או הוסף את שיטות הבדיקה שבהן ברצונך להשתמש:

    • הוסף שיטה חדשה:
      1. בחר הוסף שיטת בדיקה.
      2. בחר את כל השיטות שברצונך לבדוק איתם ולאחר מכן בחר אישור.
      3. שיטות מסוימות דורשות ציון עובר. ניקוד המעבר קובע מהו הניקוד שגורם למעבר או כשל. הגדר את הציון ולאחר מכן בחר אישור.
      4. שיטות מסוימות דורשות הוספת תגובות צפויות או מילות מפתח עבור כל אחד מהמקרים שלך. לקבלת מידע נוסף, ראה בחירת שיטות הערכה.
    • בחר שיטת בדיקה קיימת לעריכה או למחיקה.
    שיטת בדיקה מדידות סוג ערכת בדיקה הבקיע תצורות
    איכות כללית עד כמה טובה התגובה של מקרה בדיקה מבוססת על תכונות ספציפיות תגובה בודדת או שיחה אחת ציון מתוך 100 אחוזים ללא
    השוואת משמעות עד כמה המשמעות של התשובה של תיק הבדיקה תואמת לתשובה הצפויה תגובה יחידה ציון מתוך 100 אחוזים ציון מעבר, תשובה צפויה
    שימוש ביכולת אם מקרה הבדיקה השתמש בכל המשאבים הצפויים או בכלל תגובה יחידה מעבר/כשל יכולות צפויות
    התאמת מילת מפתח אם מקרה הבדיקה השתמש בכל מילות המפתח או בצירופי המילים הצפויים תגובה בודדת או שיחה אחת מעבר/כשל מילות מפתח או צירופי מילים צפויה
    דמיון טקסט עד כמה הטקסט של התשובה של מקרה הבדיקה תואם לתשובה הצפויה תגובה יחידה ציון מתוך 100 אחוזים ציון מעבר, תשובה צפויה
    התאמה מדויקת אם התשובה של מקרה הבדיקה תואמת בדיוק לתשובה הצפויה תגובה יחידה מעבר/כשל תשובה צפויה
  6. ערוך את הפרטים של מקרי הבדיקה. כל שיטות הבדיקה, למעט איכות כללית, דורשות תגובות צפויות או מילות מפתח. לקבלת מידע נוסף אודות עריכת מקרי בדיקה, ראה שינוי ערכת בדיקה.

  7. בחר פרופיל משתמש, לאחר מכן בחר או הוסף את החשבון שבו ברצונך להשתמש עבור ערכת בדיקה זו, או המשך ללא אימות. ההערכה משתמשת בחשבון זה כדי להתחבר למקורות וכלים של ידע במהלך הבדיקה. אם נבחר חשבון אחר להערכה מאשר החשבון עם אימות מחבר, סוכנים המשתמשים במחברים או בכלים ייכשלו. לקבלת מידע אודות הוספה וניהול של פרופילי משתמשים, ראה ניהול פרופילי משתמשים וחיבורים.

    הערה

    בדיקות אוטומטיות משתמשות באימות של חשבון הבדיקה שנבחר. אם לנציג שלך יש מקורות ידע או חיבורים הדורשים אימות ספציפי, בחר את החשבון המתאים לבדיקה שלך. כאשר Copilot Studio יוצר מקרי בדיקה, הוא משתמש באישורי האימות של חשבון מחובר כדי לגשת למקורות ול כלים של הסוכן שלך. מקרי בדיקה שנוצרו יכולים לכלול נתונים רגישים שהחשבון המחובר יכול לגשת אליהם. כל יוצר בעל גישה לסוכן יכול גם להציג את ערכות הבדיקה המקושרות לסוכן זה.

  8. בחר שמור כדי לעדכן את ערכת הבדיקה מבלי להפעיל את מקרי הבדיקה או הערך כדי להפעיל את ערכת הבדיקה באופן מיידי.

מגבלת יצירת מקרה בדיקה

יצירת מקרה בדיקה נכשלת אם שאלה אחת או יותר מפרה את הגדרות ההפית תוכן של הסוכן שלך. הסיבות האפשריות לכך כוללות:

  • ההוראות או הנושאים של הסוכן מובילים את המודל ליצירת תוכן שהמערכת מסמנת בדגל.
  • מקור הידע המחובר כולל תוכן רגיש או מוגבל.
  • הגדרות בקרת התוכן של הסוכן מחמירות מדי.

כדי לפתור את הבעיה, נסה פעולות שונות, כגון התאמת מקורות ידע, הוראות עדכון או שינוי הגדרות הנחיות.

ערכת בדיקה יכולה להכיל עד 100 מקרי בדיקה.

יצירת ערכת בדיקה מתוך ידע או נושאים

באפשרותך לבדוק את הסוכן שלך על-ידי יצירת שאלות באמצעות המידע ומקורות השיחה שיש לסוכן שלך כבר. שיטת בדיקה זו טובה לבדיקת האופן בו הסוכן שלך משתמש במקור ידע או בנושאים שכבר יש לו, אך היא אינה טובה לבדיקת פערי מידע.

באפשרותך ליצור מקרי בדיקה באמצעות מקורות ידע אלה:

  • טקסט

  • מיקרוסופט וורד

  • מיקרוסופט אקסל

באפשרותך להשתמש בקבצים שנפחם עד 5 MB כדי ליצור שאלות בדיקה.

כדי ליצור ערכת בדיקה:

  1. בהערכה חדשה, בחר קבוצת שאלות מלאה.

  2. בחר ידע או נושאים.

    • ידע פועל בצורה הטובה ביותר עבור סוכנים המשתמשים בתזמור גנרטיבי. שיטה זו יוצרת שאלות באמצעות אחד ממקורות הידע של הסוכן שלך.
    • הנושאים פועלים בצורה הטובה ביותר עבור סוכנים המשתמשים בתימור קלאסי. שיטה זו יוצרת שאלות באמצעות הנושאים של הסוכן שלך.
  3. עבור ידע, בחר את מקור הידע שבו ברצונך להשתמש כדי ליצור שאלות.

    צילום מסך המציג את הבחירה עבור מקורות ידע שייכללו בהפקת מקרה הבדיקה.

  4. עבור ידעונושאים, בחר וגרור את המחוון כדי לבחור את מספר השאלות שברצונך ליצור.

    צילום מסך המציג את המחוון לבחירת מספר השאלות שברצונך להפיק.

  5. בחר צור.

  6. תחת שם, הזן שם עבור ערכת הבדיקה.

    1. שנה או הוסף את שיטות הבדיקה שבהן ברצונך להשתמש:
    • הוסף שיטה חדשה:
      1. בחר הוסף שיטת בדיקה.
      2. בחר את כל השיטות שברצונך לבדוק איתם ולאחר מכן בחר אישור. באפשרותך להוסיף שיטות מרובות.
      3. בשיטות מסוימות, הגדר ציון סיסמה ולאחר מכן בחר אישור. ניקוד המעבר קובע מהו הניקוד שגורם למעבר או כשל.
      4. שיטות מסוימות דורשות הוספת תגובות צפויות או מילות מפתח עבור כל אחד מהמקרים שלך. לקבלת מידע נוסף, ראה בחירת שיטות הערכה.
    • בחר שיטת בדיקה קיימת לעריכה או למחיקה.
  7. ערוך את הפרטים של מקרי הבדיקה. כל מקרי הבדיקה המשתמשים בשיטות, למעט איכות כללית, דורשים תגובות צפויות. לקבלת מידע נוסף אודות עריכה, ראה שינוי ערכת בדיקה.

  8. בחר שמור כדי לעדכן את ערכת הבדיקה מבלי להפעיל את מקרי הבדיקה או הערך כדי להפעיל את ערכת הבדיקה באופן מיידי.

יצירת קובץ ערכת בדיקה לייבוא

במקום לבנות את מקרי הבדיקה ישירות ב- Copilot Studio, באפשרותך ליצור קובץ גיליון אלקטרוני עם כל מקרי הבדיקה ולייבא אותם כדי ליצור את ערכת הבדיקה. באפשרותך לחבר כל שאלה לבדיקה, לקבוע את שיטת הבדיקה שבה ברצונך להשתמש ולקבוע את התגובות הצפויות עבור כל שאלה. לאחר שתסיים ליצור את הקובץ, שמור אותו כקובץ .csv או .txt ויבא אותו ל- Copilot Studio.

חשוב

  • הקובץ יכול להכיל עד 100 שאלות.
  • כל שאלה יכולה להכיל עד 1,000 תווים, כולל רווחים.
  • הקובץ חייב להיות בתבנית ערכים המופרדים באמצעות פסיקים (CSV) או בתבנית טקסט.

כדי ליצור את קובץ הייבוא:

  1. פתח יישום גיליון אלקטרוני (לדוגמה, Microsoft Excel). באפשרותך להוריד תבנית CSV תחת מקור נתונים לאחר בחירת הערכה חדשה.

  2. הוסף את הכותרות הבאות, בסדר זה, בשורה הראשונה:

    • שאלה
    • התגובה הצפויה
    • שיטת בדיקה
  3. הזן את שאלות הבדיקה בעמודה שאלה . כל שאלה יכולה להכיל 1,000 תווים או פחות, כולל רווחים.

  4. הזן אחת משיטות הבדיקה הבאות עבור כל שאלה בעמודה שיטת בדיקה:

    • איכות כללית
    • השוואת משמעות
    • דמיון
    • התאמה מדויקת
    • התאמת מילת מפתח
  5. הזן את התגובות הצפויות עבור כל שאלה בעמודה התגובה הצפויה . התגובות הצפויות הן אופציונליות לייבוא ערכת בדיקה. עם זאת, אתה זקוק לתגובות צפויות כדי להפעיל התאמה, דמיון והשוואה בין מקרי בדיקה של משמעות.

  6. שמור את הקובץ כקובץ ‎ .csvאו ‎ .txt

  7. יבא את הקובץ על-ידי ביצוע השלבים ביצירה של ערכת בדיקה חדשה.

יצירת ערכת בדיקה המבוססת על ערכת נושא

צור ערכת בדיקה עם שאלות מתוך שיחות עם משתמשים אמיתיים. שיטה זו משתמשת בערכות נושא (תצוגה מקדימה) שנמצאות בניתוח של הסוכן שלך.

ערכות נושא הן קבץ של שאלות נלקחות מתוך מאגר שאלות המשתמשים המפעילות תשובות ג'נטיביות. בעת יצירת ערכת בדיקה באמצעות ערכת נושא, אתה יוצר את מקרי הבדיקה מתוך שאלות של משתמשים הקשורים לערכת נושא זו.

השתמש בערכות בדיקה אלה כדי לבצע הערכות הממוקדת באזור אחד או בנושא אחד של טווח הסוכן שלך. לדוגמה, אם יש לך סוכן שירות לקוחות, באפשרותך לעקוב אחר איכות התשובות עבור שאלות בנושא חיוב ות תשלומים בנפרד ממקרי שימוש אחרים, כגון פתרון בעיות.

הערה

לפני יצירת ערכות בדיקה מתוך ערכות נושא, דרושה לך גישה לערכות נושא בניתוח. סקור את הדרישות המוקדמות עבור ערכות נושא (תצוגה מקדימה).

  1. בעמוד הניתוח של הסוכן שלך, עבור לרשימת נושאים.

  2. רחף מעל ערכת נושא ולאחר מכן בחר הערכה.

    צילום מסך המציג את האפשרות 'הערכה' עבור ערכת נושא ברשימה 'ערכות נושא'.

    באפשרותך גם לבחור הצג הכל כדי לראות ערכות נושא נוספות ולאחר מכן לבחור הערכה.

  3. בחר צור ופתח.

  4. ערוך את הפרטים של ערכות הבדיקה והמקרים. כל מקרי הבדיקה המשתמשים בשיטות, למעט איכות כללית, דורשים תגובות צפויות. לקבלת מידע נוסף אודות עריכה, ראה שינוי ערכת בדיקה.

  5. בחר שמור כדי לעדכן את ערכת הבדיקה מבלי להפעיל את מקרי הבדיקה או הערך כדי להפעיל את ערכת הבדיקה באופן מיידי.