共用方式為


分析常見問題集

這些常見問題(FAQ)描述了 Copilot Studio 分析協助功能的 AI 效果。

生成式 AI 如何應用於分析?

Copilot Studio 利用 AI 來衡量生成答案的品質並建立群組。 這些叢集提供關於客服人員效能的洞見。

生成式回答使用 你選擇的知識來源來產生回應。 這個功能也會收集你提供的任何意見反應。 分析利用大型語言模型(LLM)將用戶與客服之間的聊天訊息分類為反映生成性回應品質的層級。 Copilot Studio 會彙整這些指標,讓你對客服人員整體表現有個總結。

叢集利用大型語言模型 (LLM) 將使用者訊息依據共用主題分類到群組,並為每個群組提供描述性名稱。 Copilot Studio 利用這些叢集名稱,提供不同類型的洞察,幫助你提升你的客服人員。

生成式答案的回應品質

預期使用的回應品質如何?

利用回應品質分析來發掘客服人員使用與績效的洞察,並制定行動以促進客服人員的改進。 目前,你可以利用分析來判斷客服人員生成式回答的品質是否符合你的期望。

除了整體品質外,回應品質分析還能找出客服表現不佳或未能達成預期目標的領域。 你可以定義生成式答案表現不佳的領域,並採取措施提升其品質。

在發現表現不佳時,請遵循有助於提升品質的最佳實務。 例如,在辨識出效能不佳的知識來源後,你可以編輯該知識來源,或將它拆分成多個更聚焦的來源以提升品質。

用什麼資料來建立回應品質的分析?

回應分析的品質是使用 產生式回應 的範例來計算。 它需要使用者查詢、Agent 回應,以及生成模型用於生成答案的相關知識來源。

回應品質分析利用這些資訊來評估生成答案的品質是否良好,若不佳,則判斷為何品質不佳。 例如,回應品質可以辨識不完整、無關或缺乏根基的回應。

回應分析品質的限制有哪些?使用者該如何減少這些限制的影響?

  • 回應品質分析並不使用所有生成式回應。 相反地,分析會測量使用者 Agent 工作階段的樣本。 成功生成答案數量少於最低數量的代理人,無法獲得高品質回應分析摘要。

  • 有些分析無法準確評估個別回應。 綜合來看,大多數情況下應該是準確的。

  • 回應品質分析無法細分導致低品質表現的具體查詢。 他們也沒有提供當低品質回應時所使用的共通知識來源或主題的細分。

  • 分析不會針對使用 產生知識的答案進行計算。

  • 答案完整性是評估回應品質的指標之一。 此指標衡量回應對檢索文件內容的完整性。

    如果系統沒有取得相關文件並附有該問題的額外資訊,就不會評估該文件的完整性指標。

在 Copilot Studio 中,為了確保負責任的 AI 的回應分析品質,有哪些保障措施?

Agent 的使用者看不到分析結果;這些服務只對 Agent 製作者和管理員開放。

製作者和管理員只能使用回應品質分析來查看優質回應的百分比,以及任何預設的表現不佳原因。 製作者只能看到優質回應的百分比和預先定義的原因。

我們在開發過程中徹底測試了回應品質的分析,以確保良好的效能。 然而,在極少數情況下,反應評估的品質可能不準確。

對話階段的情感分析

情感分析的預期用途是什麼?

利用情感分析,根據 AI 對用戶訊息的分析,了解用戶在對話過程中的滿意度。 你可以了解整個療程的情緒(正面、負面或中立),調查原因,並採取措施加以解決。

在會話中,哪些數據用來定義情感?

Copilot Studio 根據用戶發送給客服人員的訊息,計算情感分析,提供一組範例對話會話。

情感分析利用這些資訊評估使用者在會話期間的滿意度是正面、負面還是中性。 例如,使用者可以用詞語和語氣表達挫折或不滿,這取決於與客服的互動。 在這種情況下,該場次被歸類為負面情緒。

情感分析的限制是什麼?使用者又該如何彌補這些限制?

情緒分析並非用所有對話會話來計算。 相反地,分析會測量使用者 Agent 工作階段的樣本。 每日成功生成回答數低於最低數量的代理人無法獲得情感分數。

情感分析目前依賴生成式答案,且每日至少有若干成功答案以計算代理人的情感分數。

要計算會話的情緒,必須至少有兩則使用者訊息。 此外,由於目前的技術限制,對於總共超過 26 則訊息(包含使用者與代理訊息)的會話,情感分析不會進行

情感分析無法細分導致情緒分數的具體用戶訊息。

在 Copilot Studio 中,負責任的 AI 情緒分析有哪些保護措施?

Agent 的使用者看不到分析結果;這些服務只對 Agent 製作者和管理員開放。

你只能用情緒分析來查看所有場次的情緒分布。

我們在開發過程中徹底測試了情感分析,以確保良好的效能。 然而,在極少數情況下,情緒評估可能不準確。

使用者問題主題

Themes 的預期用途是什麼?

此功能會自動分析大量使用者查詢,並將其分組為稱為主題的高階主題。 每個主題代表使用者詢問的單一高層次主題。 主題提供無監督、以數據驅動的使用者內容視角。 此檢視幫助團隊了解使用者最關心的事項,而無需手動審核數千份查詢。

用什麼資料來建立叢集?

主題功能利用使用者查詢觸發生成式回應。 主題分析過去七天內的所有查詢,產生新的建議主題。

Themes 利用語意相似性來進行群組查詢。 接著會使用語言模型來產生每個群組的標題與描述。 同時也會收集製作者的回饋 (如按讚/倒讚) 以提升聚類品質。

主題群組的限制是什麼?使用者該如何減輕這些限制?

成功依主題群聚取決於查詢量。 如果查詢數量不足或查詢彼此過於不相關,Copilot Studio 可能會將查詢群組成過於寬泛或過於狹窄的主題。

主題有時會拆分相似主題或合併無關主題。

查詢中語言的變化可能會隨時間影響叢集的一致性。

你可以定期檢視主題並提供回饋,以提升命名品質。

Copilot Studio 內部針對主題有哪些負責任的 AI 保護措施?

主題只對創作者和管理員開放。 產生名稱與描述時會應用內容審查,以降低有害或不適當輸出的風險。

自訂指標分析

自訂指標的預期用途是什麼?

創客利用客製化指標分析來了解對話客服對業務成果的影響程度。 這些指標補充了儲蓄分析。 自訂指標的例子包括解決率、客戶意圖分類及其他領域特定結果。

自訂指標可以顯示客服人員未達成預期目標的地方。 製作者可以定義要衡量的項目,與真實會話資料測試指標,並根據結果精煉定義。

計算自訂指標會使用哪些資料?

自訂指標是根據過去客服人員會話的樣本計算。 計算利用會話中交換的對話訊息。

AI 模型會根據你的指標定義來分類會話資料。 代理人會將樣本中的結果彙整,以顯示所選期間的整體指標表現。

自訂指標的限制是什麼?使用者如何減少限制的影響?

自訂指標並非使用所有客服會話計算。 他們會測量選定時期的抽樣會議。 由於結果是基於樣本,應視為方向指標而非精確數字。

你應該考慮到,解釋指標時的計算是基於訊息記錄。 避免對主要發生在訊息之外的行為(如主題和工具)下結論。

AI 模型可能會誤判會話。 總體結果通常準確。 不符合特定類別的會話會被歸入備用(其他)類別。 如果測試結果與預期結果不符,你可以更新指標描述和分類定義。

若指標定義後,代理的指令或設定有重大變更,該指標可能不再準確反映代理的更新行為。 在對代理人做實質性修改後,你應該先檢視他們的自訂指標。

在 Copilot Studio 中,負責任的 AI 對自訂指標有哪些保護措施?

自訂指標結果僅提供給代理製作者與管理員使用。 代理的使用者無法取得分析結果。

儲存前請檢視並核准所有自訂指標。 在度量定義過程中,與樣本會話資料進行度量測試,並檢視個別結果及模型推理。 如果結果未達預期,你可以更新或捨棄該指標。 沒有你明確確認,指標不會被套用。

用來分類會話的 AI 提示會在使用者介面中顯示,讓你了解模型如何解讀你的指標定義。 你可以隨時編輯或移除自訂指標。

在極少數情況下,個別會話分類可能不準確。 結果應以整體方式解讀,而非個別會議層級。