共用方式為


修改測試集內的測試案例

[本文章是發行前版本文件,且隨時可能變更。]

建立測試集的過程中或之後,你可以透過修改題目措辭、選擇不同的測試方法,或根據需要調整預期答案來編輯測試案例。 您可以藉由選取個別測試案例旁邊的核取方塊,選擇多個測試案例來進行大量編輯。

你可以選擇三種測試方法,也稱為評分器,來評估代理人的回應:品質、相似度和文字匹配。 如需不同測試方法的詳細資訊,請參閱測試方法

編輯測試集內的測試案例

  1. 在你的代理人 評估 頁面,選擇測試集。

  2. 在測試組中,選取要編輯的測試案例。

螢幕擷取畫面顯示測試案例清單。

  1. 在右窗格中,編輯問題欄位中的文字,以變更問題的措辭。

螢幕擷取畫面顯示問題文字欄位。

  1. 選取您要使用的測試方法

螢幕擷取畫面顯示測試方法選取項目。

  • 質量

    • 選取一般品質,根據相關性、契合性和完整性來評估解答。

    • 選取比較含義,根據解答對預期回覆含義的掌握程度來進行評估。 在通過分數底下,您可以設定判定解答通過的分數閾值。

      預期回覆方塊中,提供測試方法評估 Agent 解答所依據的回覆。

  • 相似性:使用餘弦相似度指標來評估客服專員的回答與預期回應的措辭和含義的相似程度。 這會決定介於 0 到 1 之間的分數,其中 1 表示高度相符,0 表示完全不相符。 在通過分數底下,您可以設定判定解答通過的分數閾值。

    預期回覆方塊中,提供測試方法評估 Agent 解答所依據的回覆。

  • 文字匹配

    • 選取完全相符,以根據預期回覆評估 Agent 的解答,其中通過分數表示 Agent 的解答與定義的預期回覆完全相符。

      預期回覆方塊中,提供測試方法評估 Agent 解答所依據的回覆。

    • 選擇 關鍵字匹配 以評估代理人的回答與預期回應,其中及格分數表示代理人的回答包含了定義期望回應中的部分詞語或片語。

      預期回覆方塊中,提供測試方法評估 Agent 解答所依據的字詞或關鍵字。 若要新增多個關鍵字或字詞,請選取新增、選取方塊之間的運算子 ,然後提供關鍵字或字詞。

      截圖展示了如何加入關鍵字以匹配預期回應的關鍵字。

  1. 選取 ,然後套用

  2. 完成變更後,選擇 儲存 以儲存測試集,或選擇 評估執行測試

在測試集中新增更多測試案例

在建立或編輯測試集時,你可以新增更多測試案例。

  1. 在你的代理人 評估 頁面,選擇測試集。

  2. 產生或手動新增更多測試案例。

截圖顯示「產生10個問題」和「手動新增案例」按鈕,位於檢視你的測試案例頁面。

  1. 選取並 編輯任何新的測試案例 以增加細節。