[本文章是發行前版本文件,且隨時可能變更。]
一個 測試集 包含最多 100 個 測試案例。 當你執行代理評估時,你會選擇一個測試集,Copilot Studio 會將該測試集裡的所有測試案例都針對你的代理執行。
你可以手動在測試集內建立測試案例,或使用試算表匯入,或利用 AI 根據客服設計與資源生成訊息。 接著你可以選擇如何衡量代理人在測試集內每個測試案例回應的品質。
欲了解更多代理人評估的運作方式,請參閱 《關於代理人評估》。
這很重要
Copilot Studio 的測試結果可查閱 89 天。 若要儲存測試結果較長時間,請匯 出 結果為 CSV 檔案。
建立新的測試集
前往你經紀人的 評估 頁面。
選擇 新測試集。
在 「新測試集 」頁面,選擇你想用來建立測試集的方法。 一個測試集最多可包含 100 個測試案例。
- 快速問題設定為讓 Copilot Studio 根據你客服人員的描述、指示和能力自動建立測試案例。 此選項產生 10 題,用於執行小型快速評估或開始建立較大的測驗集。
- 完整題目組,讓 Copilot Studio 利用你客服的知識來源或主題生成測試案例。
-
利用你的測試聊天對話 ,自動填入你在 測試聊天中提供的問題。 此方法使用最新測試聊天室的題目。 你也可以在測試聊天中使用評估
按鈕開始評估。
- 從 檔案 中匯入測試案例時,方法是將檔案拖曳至指定區域 ,選擇瀏覽 以上傳檔案,或選擇其他上傳選項之一。
- 或者,自己寫一些題目 ,手動建立一個測驗集。 請依照步驟 編輯測試集 以新增和編輯測試案例。
編輯測試案例的細節。 所有使用方法的測試案例,除了 一般品質外,都需要預期的回應。 欲了解更多編輯資訊,請參閱 「修改測試集」。
在名稱底下,輸入測試組的名稱。
選擇 使用者設定檔,然後選擇或新增你想用於此測試組的帳號,或繼續進行不驗證。 評估在測試期間利用此帳號連結知識來源與工具。 關於新增與管理使用者設定檔的資訊,請參閱 管理使用者設定檔與連線。
備註
自動化測試則是透過所選測試帳號的驗證。 如果您的代理人擁有需要特定認證的知識來源或人脈,請選擇適合的帳號進行測試。
- 選擇 「儲存 」以更新測試集,但不執行測試案例;選擇 「評估 」以立即執行測試集。
測試案例產生限制
如果有一個或多個問題違反代理的內容審核設定,測試案例產生可能會失敗。 原因包括:
- 代理人的指示或主題會引導模型產生被標記的內容。
- 連結的知識來源包含敏感或受限內容。
- 代理人的內容審核設定過於嚴格。
要解決問題,可以嘗試不同操作,例如調整知識來源、更新指示或調整審核設定。
一個測試集最多可包含 100 個測試案例。
從知識或主題產生測試集
你可以利用代理人已有的資訊和對話來源來產生問題來測試你的代理人。 這種測試方法適合測試代理人如何運用已有的知識和主題,但不適合用來測試資訊缺口。
你可以透過以下知識來源產生測試案例:
- 文字
- Microsoft Word
- Microsoft Excel
你可以使用最大 293 KB 的檔案來產生測驗題目。
要產生測試集:
在 新測驗集中,選擇 完整題組。
選擇 知識 或 主題。
對於 知識,選擇你想納入題目產生的知識來源。
- 關於 知識 與 主題,選擇並拖曳滑桿以選擇產生的問題數量。
選擇產生。
編輯測試案例的細節。 所有使用方法的測試案例,除了 一般品質外,都需要預期的回應。 欲了解更多編輯資訊,請參閱 「修改測試集」。
選擇 「管理個人檔案 」以選擇或連結你想用於此測試集的帳號。 你也可以不加帳號來驗證就繼續。
備註
自動化測試則是透過所選測試帳號的驗證。 如果您的代理人擁有需要特定認證的知識來源或人脈,請選擇適合的帳號進行測試。
當 Copilot Studio 產生測試案例時,會利用連接帳號的認證憑證來存取你座席的知識來源和工具。 產生的測試案例或結果可能包含相關帳號可存取的敏感資訊,且這些資訊對所有能存取測試集的創作者皆可見。
- 選擇 「儲存 」以更新測試集,但不執行測試案例;選擇 「評估 」以立即執行測試集。
建立一個測試集檔案來匯入
您可以不直接在 Copilot Studio 建置測試案例,而是建立包含所有測試案例的試算表檔案,然後匯入以建立測試組。 您可以撰寫每個測試問題、確定要使用的測試方法,並指定每個問題的預期解答。 完成檔案建立後,將其儲存為 .csv 或 .txt 檔案,並將其匯入 Copilot Studio。
這很重要
- 該文件最多可以包含 100 個問題。
- 每個問題最多可以有 1,000 個字元,包括空格。
- 檔案必須採用逗號分隔值 (CSV) 或文字格式。
若要建立匯入檔案:
開啟試算表應用程式 (例如 Microsoft Excel)。
在第一列中依此順序新增下列標題:
- Question
- 預期的回覆
- 測試方法
在問題欄中輸入您的測試問題。 每個問題可以不超過 1,000 個字元,包括空格。
在 「測驗方法 」欄位中,請輸入以下其中一種測驗方法:
- 一般品質
- 比較含義
- 相似度
- 完全相符
- 關鍵字匹配
在預期回覆欄中輸入每個問題的預期回覆。 匯入測試組的預期回覆是選用的。 不過,您需要預期回覆來執行比對、相似性及比較含義測試案例。
將檔案儲存為 .csv 或 .txt 檔案。
依照 「建立新測試集」的步驟匯入檔案。