瞭解可觀察性

已完成

有許多方法可以測量產生的 AI 回應品質。 一般而言,您可以考慮三個維度來評估及監視生成式 AI。 這些包括:

  • 效能和質量評估工具:評估所產生內容的正確性、基礎性和相關性。
  • 風險和安全性評估工具:評估與 AI 產生的內容相關聯的潛在風險,以防範內容風險。 這包括評估 AI 系統對於產生有害或不當內容的傾向。
  • 自訂評估工具:符合特定需求和目標的產業特定計量。

Microsoft Foundry 支援可 觀察 性功能,提升生成式 AI 回應的效能與可信度。 評估器 是 Microsoft Foundry 中專門的工具,用以衡量 AI 回應的品質、安全性與可靠性。

一些評估工具包括:

  • 基礎性:測量回應在擷取內容方面的一致程度。
  • 相關性:測量響應與查詢相關的程度。
  • 流暢度:測量自然語言品質和可讀性。
  • 一致性:測量響應的邏輯一致性和流程。
  • 內容安全性:全面評估各種安全性考慮。

接下來,讓我們在 Microsoft Foundry 入口網站中試用生成式 AI 功能。