เลือกวิธีการประเมิน

เมื่อคุณสร้างชุดทดสอบ ให้เลือกจากวิธีการทดสอบต่างๆ เพื่อประเมินการตอบสนองของตัวแทนของคุณ วิธีการทดสอบแต่ละวิธีมีจุดแข็งของตัวเองและเหมาะกับการประเมินประเภทต่างๆ

วิธีทดสอบ	หน่วยวัด	ชนิดของชุดการทดสอบ	การให้คะแนน	การตั้งค่าคอนฟิก
คุณภาพทั่วไป	ความดีของการตอบสนองของกรณีทดสอบที่ขึ้นอยู่กับคุณสมบัติเฉพาะคือเท่าใด	การตอบกลับหรือการสนทนาเดียว	คะแนนเต็ม 100%	None
เปรียบเทียบความหมาย	ความหมายของคําตอบของกรณีทดสอบตรงกับคําตอบที่คาดหวังมากน้อยเพียงใด	การตอบสนองครั้งเดียว	คะแนนเต็ม 100%	คะแนนที่ผ่าน, คำตอบที่คาดหมาย
การใช้เครื่องมือ	ไม่ว่ากรณีการทดสอบจะใช้ทรัพยากรที่คาดไว้ทั้งหมดหรือไม่	การตอบสนองครั้งเดียว	ผ่าน/ไม่ผ่าน	ความสามารถที่คาดหวัง
การจับคู่คีย์เวิร์ด	กรณีทดสอบใช้คําหลักหรือวลีที่คาดหวังทั้งหมดหรือบางส่วนหรือไม่	การตอบกลับหรือการสนทนาเดียว	ผ่าน/ไม่ผ่าน	คีย์เวิร์ดหรือวลีที่คาดหวัง
ความคล้ายคลึงกันของข้อความ	ข้อความของคําตอบของกรณีทดสอบตรงกับคําตอบที่คาดหวังมากน้อยเพียงใด	การตอบสนองครั้งเดียว	คะแนนเต็ม 100%	คะแนนที่ผ่าน, คำตอบที่คาดหมาย
ตรงกันเป๊ะ	คําตอบของกรณีทดสอบตรงกับคําตอบที่คาดไว้หรือไม่	การตอบสนองครั้งเดียว	ผ่าน/ไม่ผ่าน	คําตอบที่คาดหวัง
ธรรมเนียม	ไม่ว่าการตอบสนองของกรณีการทดสอบตรงกับเกณฑ์หรือความคาดหวังที่กําหนดของคุณหรือไม่	การตอบกลับหรือการสนทนาเดียว	ผ่าน/ล้มเหลว (ผ่านเกณฑ์ป้ายชื่อที่กําหนด)	ชื่อ คําแนะนําการประเมินผล ป้ายชื่อ

เพิ่มวิธีการทดสอบ

เมื่อสร้างหรือแก้ไขชุดทดสอบ ให้เลือก เพิ่มวิธีทดสอบ
เลือกวิธีการทั้งหมดที่คุณต้องการทดสอบ จากนั้นเลือก ตกลง คุณสามารถเพิ่มได้หลายวิธี
1. บางวิธีต้องมีคะแนนผ่าน คะแนนผ่านจะเป็นตัวกําหนดคะแนนที่ส่งผลให้ผ่านหรือล้มเหลว ตั้งค่าคะแนน จากนั้นเลือก ตกลง
2. วิธีการทดสอบบางอย่างจําเป็นต้องมีเกณฑ์เพิ่มเติม
เลือก บันทึก เพื่อบันทึกการเปลี่ยนแปลงของคุณในชุดทดสอบ

เลือกวิธีการทดสอบที่มีอยู่เพื่อแก้ไขเกณฑ์ของเมธอดนั้นหรือลบเมธอดนั้น

คุณภาพทั่วไป

พร้อมใช้งานสําหรับชุดทดสอบการตอบกลับและการสนทนาเดี่ยว คุณภาพทั่วไป ช่วยให้คุณตัดสินใจได้ว่าคําตอบของตัวแทนของคุณตรงตามมาตรฐานของคุณหรือไม่ ใช้แบบจําลองภาษาขนาดใหญ่ (LLM) เพื่อประเมินว่าเจ้าหน้าที่ตอบคําถามของผู้ใช้ได้อย่างมีประสิทธิภาพเพียงใด

คุณภาพทั่วไปจะมีประโยชน์อย่างยิ่งเมื่อไม่มีคําตอบที่แน่นอน นําเสนอวิธีที่ยืดหยุ่นและปรับขนาดได้ในการประเมินการตอบกลับตามเอกสารที่ดึงมาและโฟลว์การสนทนา

ใช้เกณฑ์หลักเหล่านี้และใช้ข้อความแจ้งที่สอดคล้องกันเพื่อเป็นแนวทางในการให้คะแนน:

ความเกี่ยวข้อง: คําตอบของเอเจนต์ตอบคําถามในขอบเขตใด ตัวอย่างเช่น คําตอบของเจ้าหน้าที่ยังคงอยู่ในหัวเรื่องและตอบคําถามโดยตรงหรือไม่?
เหตุผล: การตอบของเอเจนต์ขึ้นอยู่กับบริบทที่ให้ไว้ ตัวอย่างเช่น การอ้างอิงการตอบของเอเจนต์หรือพึ่งพาข้อมูลที่ระบุในบริบทแทนที่จะแนะนําข้อมูลที่ไม่เกี่ยวข้องหรือไม่รองรับหรือไม่
ความสมบูรณ์: การตอบของเอเจนต์ให้ข้อมูลที่จําเป็นทั้งหมด ตัวอย่างเช่น การตอบของเอเจนต์ครอบคลุมทุกแง่มุมของคําถามและให้รายละเอียดที่เพียงพอหรือไม่
การละเว้น: เอเจนต์ได้พยายามตอบคําถามหรือไม่

การตอบสนองจะต้องเป็นไปตามเกณฑ์หลักเหล่านี้ทั้งหมด หากไม่ตรงตามเกณฑ์หนึ่ง ระบบจะตั้งค่าสถานะการตอบกลับเพื่อปรับปรุง วิธีการให้คะแนนนี้ช่วยให้แน่ใจว่าเฉพาะคําตอบที่ทั้งสมบูรณ์และได้รับการสนับสนุนอย่างดีเท่านั้นที่ได้รับคะแนนสูงสุด ในทางกลับกันคําตอบที่ไม่สมบูรณ์หรือขาดหลักฐานสนับสนุนจะได้รับคะแนนต่ํากว่า

เมื่อเพิ่มหรือแก้ไขวิธีการทดสอบ ให้เลือก คุณภาพทั่วไป ชุดทดสอบทั้งหมดเริ่มต้นด้วยวิธีนี้โดยค่าเริ่มต้น

คุณไม่จําเป็นต้องเพิ่มคําตอบที่คาดหวังให้กับกรณีทดสอบเพื่อทําการประเมินคุณภาพทั่วไปให้เสร็จสมบูรณ์

Note

การลดจํานวนแหล่งข้อมูลความรู้สําหรับตัวแทนไม่รับประกันว่าจะสามารถปรับปรุงการไล่ระดับคุณภาพทั่วไปในการประเมินผลตัวแทนได้ ข้อจํากัดนี้มีอยู่เนื่องจากความรู้ที่ถูกเรียกใช้ (ความรู้ที่แบบจําลองคิดว่าเกี่ยวข้องกับกรณีการทดสอบเฉพาะ) อาจใหญ่เกินไป

เปรียบเทียบความหมาย

พร้อมใช้งานสําหรับชุดการทดสอบการตอบสนองเดียว การเปรียบเทียบความหมาย จะประเมินผลว่าคําตอบของเอเจนต์สะท้อนความหมายที่คาดไว้ของการตอบที่คาดหวังได้ดีเพียงใด แทนที่จะมุ่งเน้นไปที่ถ้อยคําที่แน่นอน แต่จะใช้ความคล้ายคลึงกันของเจตนา ซึ่งหมายความว่าจะเปรียบเทียบแนวคิดและความหมายเบื้องหลังคํา เพื่อตัดสินว่าคําตอบนั้นสอดคล้องกับสิ่งที่คุณคาดหวังมากน้อยเพียงใด

เช่นเดียวกับคุณภาพทั่วไป การเปรียบเทียบความหมายจะมีประโยชน์อย่างยิ่งเมื่อไม่มีคําตอบที่แน่นอน นําเสนอวิธีที่ยืดหยุ่นและปรับขนาดได้ในการประเมินการตอบกลับตามเอกสารที่ดึงมาและโฟลว์การสนทนา

คุณสามารถตั้งค่าเกณฑ์คะแนนที่ผ่านเพื่อกําหนดว่าเท่าใดเป็นคะแนนที่ผ่านสําหรับคําตอบ คะแนนผ่านเริ่มต้นคือ 50 วิธหารทกาอบการเปรียบเทียบความหมายเป็นประโยชน์เมื่อคําตอบสามารถถูกพูดในแบบที่ถูกต้องต่างกัน แต่ความหมายโดยรวมหรือจุดประสงค์ยังคงต้องเหมือนกัน

เมื่อเพิ่มหรือแก้ไขวิธีการทดสอบ ให้เลือกเปรียบเทียบความหมาย
กําหนดคะแนนผ่านสําหรับวิธีนี้
เพิ่มคําตอบที่คาดหวัง กรณีการทดสอบใด ๆ ที่ไม่มีคําตอบที่คาดหวังจะสร้างผลลัพธ์ ที่ไม่ถูกต้อง สําหรับวิธีการทดสอบนี้
1. เลือกกรณีทดสอบ
2. เพิ่มคําตอบที่คุณคาดหวัง
3. เลือก นําไปใช้ เพื่อบันทึกคําตอบที่คาดไว้
4. ทําซ้ําสําหรับกรณีทดสอบทั้งหมดที่คุณต้องการทดสอบโดยใช้วิธีนี้

การใช้เครื่องมือ

พร้อมใช้งานสําหรับชุดการทดสอบการตอบสนองเดียว เครื่องมือจะใช้ การทดสอบหากเอเจนต์ใช้เครื่องมือหรือหัวข้อเฉพาะในการสร้างคําตอบ ถ้าเป็นเช่นนั้น ก็จะผ่าน หากไม่เป็นเช่นนั้น จะล้มเหลว

เมื่อเพิ่มหรือแก้ไขวิธีทดสอบ ให้เลือก เครื่องมือที่ใช้
เพิ่มเครื่องมือหรือหัวข้อที่คาดหวัง กรณีการทดสอบใด ๆ ที่ไม่มีคําตอบที่คาดหวังจะสร้างผลลัพธ์ ที่ไม่ถูกต้อง สําหรับวิธีการทดสอบนี้
1. เลือกกรณีทดสอบ หากต้องการเพิ่มเครื่องมือและหัวข้อที่คาดหวังเดียวกันสําหรับกรณีทดสอบทั้งหมด ให้เลือกไอคอน แก้ไข ในส่วนหัวของคอลัมน์ เครื่องมือ
2. ในแผง เลือกเครื่องมือ เลือกหัวข้อหรือเครื่องมือที่คุณต้องการให้ตัวแทนของคุณใช้สําหรับกรณีการทดสอบนั้น
3. เลือก ตกลง
4. เลือก บันทึก เพื่อบันทึกการเปลี่ยนแปลง
5. ทําซ้ําสําหรับกรณีการทดสอบทั้งหมดที่คุณต้องการทดสอบสําหรับเครื่องมือที่ใช้

การจับคู่คีย์เวิร์ด

พร้อมใช้งานสําหรับชุดทดสอบการตอบกลับและการสนทนาเดี่ยว การจับคู่คําสําคัญ จะตรวจสอบว่าคําตอบของตัวแทนมีคําหรือวลีบางส่วนหรือทั้งหมดจากคําตอบที่คาดหวังที่คุณกําหนดหรือไม่ ถ้าเป็นเช่นนั้น ก็จะผ่าน หากไม่เป็นเช่นนั้น จะล้มเหลว

คุณสามารถเลือกได้ว่าบัตรผ่านต้องใช้คีย์เวิร์ดใดๆ หรือคีย์เวิร์ดทั้งหมด การเลือก Any หมายความว่า หากคําหรือวลีอย่างน้อยหนึ่งคําตรงกัน กรณีทดสอบจะผ่าน การเลือกทั้งหมดหมายความว่าคําหรือวลีที่คาดหวังทั้งหมดต้องตรงกันเพื่อให้กรณีทดสอบผ่าน

เมื่อเพิ่มหรือแก้ไขวิธีทดสอบ ให้เลือกการจับคู่คีย์เวิร์ด
เลือกว่ากรณีทดสอบต้องการคีย์เวิร์ด ใดๆ หรือ ทั้งหมด เพื่อจับคู่
เพิ่มคีย์เวิร์ดที่คาดหวัง กรณีการทดสอบใด ๆ โดยไม่มีคําหลักที่คาดไว้จะสร้างผลลัพธ์ ที่ไม่ถูกต้อง สําหรับวิธีการทดสอบนี้
1. เลือกกรณีทดสอบ
2. ในบานหน้าต่าง แก้ไขกรณีการทดสอบ ให้เพิ่มคําสําคัญหรือวลีที่คุณคาดว่าจะมีคําตอบของกรณี
3. เลือก + เพิ่ม เพื่อเพิ่มคําหลักหรือวลีเพิ่มเติม หากต้องการลบคําหลักหรือวลี ให้เลือกไอคอน ลบ
4. เลือก นําไปใช้ เพื่อบันทึกคีย์เวิร์ดที่คาดไว้
5. ทําซ้ําสําหรับกรณีทดสอบทั้งหมดที่คุณต้องการทดสอบการจับคู่คีย์เวิร์ด

ความคล้ายคลึงกันของข้อความ

วิธีการทดสอบ ความคล้ายคลึงกันของข้อความ จะเปรียบเทียบความคล้ายคลึงกันของการตอบสนองของตัวแทนต่อการตอบสนองที่คาดไว้ที่คุณกําหนดไว้ในชุดการทดสอบของคุณ ใช้วิธีการทดสอบนี้เมื่อคําตอบที่ถูกต้องจําเป็นต้องตรงกับการตอบสนองที่คาดไว้อย่างถูกต้อง หรือเกือบจะตรงกันทั้งในโครงสร้างคําและประโยค ตัวอย่างเช่น มักจําเป็นต้องใช้ถตดังกล่าวอย่างแม่นยําเมื่อมีการสร้างเอกสารทางกฎหมาย โดยทั่วไปการทดสอบนี้จะใช้ควบคู่ไปกับวิธีการทดสอบ การเปรียบเทียบซึ่ง ช่วยให้มั่นใจถึงความคล้ายคลึงกันของความหมาย แต่ไม่รับประกันความคล้ายคลึงกันของถ้อยคํา นอกจากนี้ยังแตกต่างจาก คําสําคัญตรงกับ วิธีการทดสอบซึ่งช่วยให้มั่นใจถึงการปรากฏของคําบางคํา แต่ไม่รับประกันความคล้ายคลึงกันของการก่อสร้าง หากคําตอบทั้งหมดต้องตรงกับคําตอบที่คาดหวัง ทั้งหมด ให้ใช้วิธีการทดสอบ การจับคู่ที่ตรงกัน แทน

เมตริกความคล้ายคลึงกันของโคไซน์จะประเมินว่าคําตอบของตัวแทนคล้ายกับการใช้ถาพยัญจน์ของการตอบสนองที่คาดไว้อย่างไร และกําหนดคะแนน คะแนนอยู่ในช่วงตั้งแต่ 0 ถึง 1 โดยที่ 1 หมายถึงการจับคู่อย่างใกล้ชิด และ 0 หมายความว่าไม่ตรงกัน คุณสามารถตั้งค่าเกณฑ์คะแนนที่ผ่านเพื่อกําหนดว่าเท่าใดเป็นคะแนนที่ผ่านสําหรับคําตอบ

เมื่อเพิ่มหรือแก้ไขวิธีการทดสอบ ให้เลือก ความคล้ายคลึงกันของข้อความ
กําหนดคะแนนผ่านสําหรับวิธีนี้
เพิ่มคําตอบที่คาดหวัง กรณีการทดสอบใด ๆ ที่ไม่มีคําตอบที่คาดหวังจะสร้างผลลัพธ์ ที่ไม่ถูกต้อง สําหรับวิธีการทดสอบนี้
1. เลือกกรณีทดสอบ
2. เพิ่มคําตอบที่คุณคาดหวัง
3. เลือก นําไปใช้ เพื่อบันทึกคําตอบที่คาดไว้
4. ทําซ้ําสําหรับกรณีทดสอบทั้งหมดที่คุณต้องการทดสอบโดยใช้วิธีนี้

ตรงกันเป๊ะ

พร้อมใช้งานสําหรับชุดการทดสอบการตอบสนองเดียว การจับคู่ที่ตรงกัน จะตรวจสอบว่าคําตอบของตัวแทนตรงกับคําตอบที่คาดไว้ในการทดสอบหรือไม่: อักขระสําหรับอักขระ คําสําหรับคํา ถ้าเหมือนกัน ก็จะผ่าน หากมีสิ่งใดแตกต่างกัน ก็จะล้มเหลว การตรงกันทุกประการจะเป็นประโยชน์สําหรับคําตอบที่สั้นและแม่นยํา เช่น ตัวเลข รหัส หรือวลีแบบคงที่ ไม่เหมาะกับคําตอบที่ผู้ใช้สามารถเลือกใช้วลีด้วยวิธีที่ถูกต้องได้หลายวิธี

เมื่อเพิ่มหรือแก้ไขวิธีการทดสอบ ให้เลือก การจับคู่ตรง
เพิ่มคําตอบที่คาดหวัง กรณีการทดสอบใด ๆ ที่ไม่มีคําตอบที่คาดหวังจะสร้างผลลัพธ์ ที่ไม่ถูกต้อง สําหรับวิธีการทดสอบนี้
1. เลือกกรณีทดสอบ
2. เพิ่มคําตอบที่คุณคาดหวัง
3. เลือก นําไปใช้ เพื่อบันทึกคําตอบที่คาดไว้
4. ทําซ้ําสําหรับกรณีทดสอบทั้งหมดที่คุณต้องการทดสอบโดยใช้วิธีนี้

ธรรมเนียม

แบบกําหนดเอง เป็นวิธีการทดสอบที่สามารถปรับแต่งได้ ซึ่งช่วยให้คุณทดสอบและติดป้ายคําตอบของตัวแทนโดยใช้เกณฑ์ของคุณเอง ตัวอย่างเช่น คุณสามารถสร้างการทดสอบการปฏิบัติตามข้อบังคับสําหรับตัวแทน HR เพื่อติดป้ายคําตอบสําหรับการทดสอบว่าเป็นไปตามข้อกําหนดหรือไม่สอดคล้องกับคําอธิบายการปฏิบัติตามข้อกําหนดของ HR ของคุณ

การทดสอบแบบกําหนดเองมีสองคอมโพเนนต์เพื่อให้คุณกําหนดค่า:

คําแนะนําการประเมินผล: อธิบายเป้าหมายที่คุณต้องการทําด้วยการทดสอบนี้ คุณต้องการทดสอบอะไรเพื่อหาคําตอบของตัวแทนของคุณ

คําแนะนําการประเมินผลที่ดีควร:

มุ่งเน้นเป้าหมาย
ใช้เฉพาะอักขระที่อนุญาตเท่านั้น
ใช้สัญลักษณ์แสดงหัวข้อย่อยและหัวเรื่องสําหรับองค์กร

ตัวอย่างเช่น

Evaluate the agent's response for HR policy compliance.

What to check:
- Determine whether the answer protects privacy and avoids revealing or requesting sensitive data.
- Avoids discrimination, bias, or inappropriate judgments.
- Provides safe, neutral, HR-aligned guidance.
- Does not give legal advice or make definitive claims.

ป้ายชื่อ: อธิบายผลลัพธ์ที่กําหนดให้กับคําตอบแต่ละรายการโดยใช้การทดสอบแบบกําหนดเอง ป้ายยังมีการกำหนดสถานะผ่าน/ไม่ผ่าน ซึ่งมีผลต่ออัตราการผ่านของชุดการทดสอบตามวิธีการนี้

ป้ายชื่อมีชื่อและคําอธิบาย คําอธิบายที่ดี:

สั้นและรัดกุม
ประกอบด้วยแอตทริบิวต์ที่คุณกําลังค้นหาในคําตอบที่ตรงกัน

กลยุทธ์หนึ่งสำหรับป้ายชื่อคือการมีสองประเภท: หนึ่งคือคำตอบที่ตรงตามเกณฑ์ที่คุณกำลังค้นหาสำเร็จ และอีกหนึ่งสำหรับคำตอบที่ไม่ตรงตามเกณฑ์ ตัวอย่างเช่น การทดสอบแบบกําหนดเองตามนโยบายของ HR อาจมี มาตรฐาน และไม่ ตรงตามมาตรฐาน เป็นป้ายชื่อ

เมื่อเพิ่มหรือแก้ไขวิธีทดสอบ ให้เลือก กําหนดเอง
ป้อนชื่อสําหรับการทดสอบแบบกําหนดเองนี้
เพิ่มคําแนะนําการประเมินผล
เพิ่มป้ายชื่อสองป้ายหรือมากกว่า แต่ละป้ายชื่อมีชื่อและคําอธิบาย

หากต้องการเพิ่มป้ายชื่อเพิ่มเติม ให้เลือก เพิ่มป้ายชื่อ

ชื่อป้ายชื่อสามารถใช้ตัวอักษร ตัวเลข ช่องว่าง ยัติภังค์ - ขีดล่าง _ เครื่องหมายทับ / แอมเปอร์แซนด์ & เครื่องหมายบวก + และ จุด . เท่านั้น
ตั้งค่าผลลัพธ์ ผ่าน หรือ ล้มเหลว สําหรับแต่ละป้ายชื่อ
เลือก ตกลง

คำติชม

หน้านี้มีประโยชน์หรือไม่

Last updated on 2026-05-19