共用方式為


穩定性偵測

Azure AI 內容安全中的基礎性偵測可協助您確保大型語言模型 (LLM) 回應是以您提供的來源資料為基礎,以降低非事實或捏造輸出的風險。

脫節性是指 LLM 產生與來源資料中內容不符或不準確的資訊。

接地性偵測需要 文件嵌入和格式化

要理解接地感偵測,熟悉以下核心概念會很有幫助:

重要詞彙

  • 擷取擴增生成 (RAG):RAG 是一種技術,可透過其他資料擴增 LLM 知識。 LLM 可以推理廣泛的主題,但其知識僅限於在訓練時可用的公用資料。 如果您想要建置能夠推理私人資料或在模型截止日期後所引進資料的 AI 應用程式,您必須提供該特定資訊給模型。 這個帶入適當資訊並將其插入模型提示的過程即稱為「擷取擴增生成」(RAG)。 如需詳細資訊,請參閱擷取擴增生成 (RAG) (英文)。
  • LLM 中的根據性和非根據性:這是指模型的輸出以提供的資訊為依據或準確地反映可靠來源的程度。 有根據的回應會嚴格遵守提供的資訊,避免猜測或捏造。 在根據性衡量中,來源資訊至關重要並會作為根據來源。

偵測模式

接地性偵測提供兩種模式,以平衡速度與可解讀性:

  • 非推理模式:適用於線上應用程式的快速偵測。 回傳二進位接地/非接地結果,且沒有詳細說明。
  • 推理模式:提供對偵測到的無接地片段的詳細說明。 更有助於了解根本原因和緩解策略。

對於延遲很重要的即時應用,請選擇非推理模式。 在開發和除錯時使用推理模式來了解為何內容會被標記。

網域選擇

選擇一個網域以優化你的使用情境偵測:

  • 醫療:針對醫療、醫療保健及科學內容優化,這些內容對準確性至關重要
  • 通用型:適合一般用途內容,包括客戶支援、文件及商業溝通

領域選擇調整偵測模型的靈敏度與校正行為,以適應特定領域專屬的術語與模式。

任務規格

指定任務類型以優化偵測:

  • 摘要:用於驗證產生的摘要與來源文件的對照
  • 問答系統:用於驗證問題與答案的回應是否符合知識庫

任務選擇會根據特定任務的模式調整偵測靈敏度與校正邏輯。

接地性修正 (預覽版)

接地偵測 API 包含一個可選 的修正功能 ,不僅能偵測無接地內容,還會根據你的接地來源自動修正。 這適用於:

  • 自動修正生成摘要中的事實錯誤
  • 確保 AI 回應與原始素材相符
  • 減少大量內容的人工審查時間

使用者案例

根據性偵測支援以文字為基礎的摘要和 QnA 工作,以確保產生的摘要或解答準確且可靠。

總結任務

  • 醫學摘要:在醫學新聞文章的內容中,可以使用根據性偵測來確保摘要不包含捏造或誤導性資訊,保證讀者獲得準確且可靠的醫學資訊。
  • 學術論文摘要:當模型產生學術論文或研究文章的摘要時,該功能可協助確保摘要內容準確地表示關鍵結果和貢獻,而不引進虛假陳述。

QnA 任務

  • 客戶支援聊天機器人:在客戶支援中,該功能可用來驗證 AI 聊天機器人提供的解答,確保客戶在詢問產品或服務相關問題時收到準確且值得信任的資訊。
  • 醫療 QnA:針對醫療 QnA,該功能可協助驗證 AI 系統提供給醫療保健專業人員和病患之醫療解答和建議的正確性,降低醫療錯誤的風險。
  • 教育 QnA:在教育情境中,該功能可應用在 QnA 工作,以確認學術問題或考試準備查詢的解答符合事實,進而在學習過程中提供支援。

請參閱下面幾個常見的案例,了解如何及何時套用這些功能,以達到最佳結果。

醫學內容中的摘要

您正在摘要醫學文件,而且摘要中病患的名稱正確且與所提供的基礎來源一致至關重要。

API 要求範例:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

預期成果:

更正功能會偵測到 Kevin 毫無根據,因為其與建基來源 Jane 發生衝突。 API 會傳回更正的文字:"The patient name is Jane."

客戶支援資料的問題與解答 (QnA) 工作

您正在為客戶支援聊天機器人實作 QnA 系統。 AI 所提供的解答必須與最新且正確的可用資訊保持一致。

API 要求範例:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

預期成果:

API 偵測到 5% 未接地,因為它不符合提供的接地來源 4.5%。 回應包含更正文字:"The interest rate is 4.5%."

使用歷史資料建立內容

您正在建立涉及歷程記錄資料或事件的內容,其中正確性對於維護可信度和避免錯誤資訊至關重要。

API 要求範例:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

預期成果:

API 會偵測到未設定的日期 1065,並根據地面來源將其更正為 1066。 回應包含更正的文字:"The Battle of Hastings occurred in 1066."

內部文件摘要

您正在摘要內部文件,其中產品名稱、版本號碼或其他特定資料點必須保持一致。

API 要求範例:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

預期成果:

更正功能會識別 SuperWidget v2.1 為未設定,並在回應中將其更新為 SuperWidget v2.2。 回應會傳回更正的文字:"Our latest product is SuperWidget v2.2."

Limitations

提供的語言

目前,接地偵測僅支援 英語內容 。 雖然 API 不限制非英語投稿,但準確性與品質已優化為英語。

文字長度限制

最大文字長度會依模式而異。 請參見 輸入電流限制 要求。

區域可用性

接地偵測功能可在特定 Azure 區域使用。 請參閱 區域可用性 以了解支援區域。

速率限制

預設查詢速率限制適用。 如需更高吞吐量需求,請聯絡 內容安全支援

根據性偵測選項

下列選項可用於 Azure AI 內容安全中的根據性偵測:

  • 選取領域:使用者可以選擇已建立的領域,以確保更量身打造符合其領域特定需求的偵測。 目前可用的網域是 MEDICALGENERIC
  • 指定工作:此功能可讓您選取正在執行的工作 (例如 QnA (問答) 和摘要),並可根據工作類型調整設定。
  • 速度與可解譯性:有兩種在速度與結果可解譯性之間權衡取捨的模式。
    • 非推理模式:提供快速偵測功能;容易內嵌至線上應用程式。
    • 推理模式:為偵測到無根據的部分提供詳細說明;更有利於理解和風險降低。

根據性更正

根據性偵測 API 包含一項更正功能,可根據所提供的基礎來源,自動更正文字中任何偵測到的非根據性。 啟用更正功能時,回應會包含 corrected Text 欄位,其中呈現與基礎來源對齊的更正文字。

最佳做法

在設定 RAG 系統以取得根據性偵測 API 的最佳效能時,請遵循下列最佳做法:

  • 處理產品名稱或版本號碼時,請直接使用來自內部發行備註或官方產品文件的基礎來源,以確保正確性。
  • 針對歷史內容,交叉參考您的基礎來源與受信任的學術或歷史資料庫,以確保最高層級的正確性。
  • 在財務等動態環境中,一律使用最新且可靠的基礎來源,以確保 AI 系統提供正確且及時的資訊。
  • 請務必確定您的基礎來源正確且為最新狀態,特別是在醫療保健等敏感性領域。 這可將摘要程序中錯誤的風險降到最低。

後續步驟

請遵循快速入門以開始使用 Azure AI 內容安全來偵測根據性。