[本文章是發行前版本文件,且隨時可能變更。]
人類監督功能允許電腦使用工具在偵測到潛在安全疑慮 (目前屬於 惡意指令類別) 時,升級至您在人工監督設定下的審查者。
注意
此功能正逐步推送到美國地區的早期發佈週期環境,可能尚未在您的環境中可用。
重要
本文包含 Microsoft Copilot Studio 預覽版文件,內容可能有所變更。
預覽功能不供生產時使用,而且可能功能受限。 這些功能是在正式發行前先行推出,讓您能夠搶先體驗並提供意見反應。
如果您要建置生產就緒 Agent,請參閱 Microsoft Copilot Studio 概觀。
AI 模型透過評估螢幕擷取畫面圖片中可能改變模型行為的敵對內容來進行偵測。 當模型在執行時標記此類指令 (過去會立即停止),現在會將請求轉接給人類驗證。 人工審查員會判斷被標記的安全問題是否真實且應停止執行,或是模型標記錯誤,程序可安全繼續。 遇到這種情況時,系統會透過電子郵件 (Outlook) 向已設定的人類審查員提出審查請求。 若在指定的逾時期內未收到回應,當逾時結束後,電腦使用執行即停止。
重要
- 電腦使用者 Agent 可能會遇到提示注入攻擊,即螢幕擷取畫面、網頁或其他輸入中的隱藏指令試圖以非預期的方式影響行動。 為降低此風險,應在受信任且隔離的環境中操作這些 Agent,並在執行任何指令前進行嚴格的驗證檢查。 啟用人工監督可透過授權人工審查員在模型偵測到潛在有害或惡意指令時,驗證標記行為,增加更多可見性與控制力,從而降低意外行為的機率。
- 電腦使用 Agent 執行的安全檢查可能由一個回應、輸入或螢幕擷取畫面觸發,或由多個此類上下文觸發。 安全檢查旨在促使人工審查,避免電腦使用 Agent 採取可能不可逆或未經允許的行動,但執行檢查時仍可能犯錯。 例如,電腦使用 Agent 可能無法偵測到某些動作,或在安全問題不關時會提示審查。 安全檢查無法取代負責任的設計與 Agent 指導。
- 人工監督功能會提示對可能不可逆或未經允許的行為進行審查,但目前不支援一般的確認請求、缺失資訊提示或其他安全檢查。
審查 Agent 與電腦使用活動
當電腦使用 Agent 偵測到潛在惡意或有害的指示時,設定的審查者會收到一封 Outlook 電子郵件。 在回應之前,確認是哪位 Agent 的活動,以及請求所涉及的電腦使用活動是非常重要的。
注意
每個 Agent 執行時,其活動都綁定於發起該 Agent 的使用者。 如果您選擇的審查者不是執行電腦 Agent 的人,他們很可能看不到該活動,因為他們沒有主動發起執行。 如果您設定多位人工審核員,他們會收到一封電子郵件,但只有發起者能存取活動細節。
下表顯示人工審查電子郵件請求中包含的主要資訊:
| 欄位 | 描述 |
|---|---|
| 使用該工具的 Agent | Copilot Studio 的 Agent 名字。 |
| 電腦使用工具 | 觸發請求的電腦使用工具名稱。 |
| 交談識別碼 | 您可以用來尋找特定活動的對話 ID。 |
| 要求逾時 | 請求逾時的日期和時間。 |
| 要求者 | 電腦使用工具的製造者 (連線擁有者)。 |
| 提交 (附選項) | 最終審查者是或否決定是否繼續或停止電腦使用執行。 |
審查電腦使用者的審核請求
注意
要在 Agent 活動地圖的電腦使用動作側面板中查看人工審查請求,您需要在環境中啟用進階電腦使用活動功能。 如果進階電腦使用活動體驗沒有出現在活動地圖中,管理員可能已經關閉了這個功能。 了解更多關於進階電腦使用活動的資訊。
要審核人工審查請求:
- 從人工審核請求郵件中複製對話識別碼 (GUID)。
- 請使用電子郵件中的工具連結選擇 Agent ,以開啟 Microsoft Copilot Studio 中的 Agent 總覽頁面。
- 移至活動。
- 在活動列表頂端,選擇依 ID 查詢並輸入複製的 對話 ID。
- 找到電腦使用動作,並以設定的電腦使用工具名稱,並打開其側面板。
- 在側邊面板的活動區,檢視活動清單。 等待人類審查的活動會在模型回應文字旁顯示等待符號。 電腦使用 Agent 執行的安全檢查可能由一個回應、輸入或螢幕擷取畫面觸發,或由多個此類上下文觸發。 因此,人工審核請求中顯示的螢幕擷取畫面本身可能不包含任何潛在惡意內容。
- 請仔細檢視活動紀錄與螢幕擷取畫面,以判斷電腦使用模式的安全檢查是否有效。
- 完成後,回到 Outlook 的電子郵件通知,並根據您的發現採取適當的行動。