基礎性偵測

發行項
10/17/2024

根據性偵測 API 會偵測大型語言模型 (LLM) 的文字回應是否以使用者所提供的來源素材為根據。非根據性是指 LLM 從來源素材中出現的資訊產生非事實或不準確資訊的執行個體。

關鍵字詞

擷取擴增生成 (RAG)：RAG 是一種技術，可透過其他資料擴增 LLM 知識。 LLM 可以推理廣泛的主題，但其知識僅限於在訓練時可用的公用資料。如果您想要建置能夠推理私人資料或在模型截止日期後所引進資料的 AI 應用程式，您必須提供該特定資訊給模型。這個帶入適當資訊並將其插入模型提示的過程即稱為「擷取擴增生成」(RAG)。如需詳細資訊，請參閱擷取擴增生成 (RAG) (英文)。
LLM 中的根據性和非根據性：這是指模型的輸出以提供的資訊為依據或準確地反映可靠來源的程度。有根據的回應會嚴格遵守提供的資訊，避免猜測或捏造。在根據性衡量中，來源資訊至關重要並會作為根據來源。

根據性偵測選項

下列選項適用於 Azure AI 內容安全性中的地面偵測：

選取領域：使用者可以選擇已建立的領域，以確保更量身打造符合其領域特定需求的偵測。目前可用的網域是 MEDICAL 與 GENERIC。
指定工作：此功能可讓您選取正在執行的工作 (例如 QnA (問答) 和摘要)，並可根據工作類型調整設定。
速度與可解譯性：有兩種在速度與結果可解譯性之間權衡取捨的模式。
- 非推理模式：提供快速偵測功能；容易內嵌至線上應用程式。
- 推理模式：為偵測到無根據的部分提供詳細說明；更有利於理解和風險降低。

使用案例

根據性偵測支援以文字為基礎的摘要和 QnA 工作，以確保產生的摘要或解答準確且可靠。以下是每個使用案例的一些範例：

摘要工作：

醫學摘要：在醫學新聞文章的內容中，可以使用根據性偵測來確保摘要不包含捏造或誤導性資訊，保證讀者獲得準確且可靠的醫學資訊。
學術論文摘要：當模型產生學術論文或研究文章的摘要時，該功能可協助確保摘要內容準確地表示關鍵結果和貢獻，而不引進虛假陳述。

QnA 工作：

客戶支援聊天機器人：在客戶支援中，該功能可用來驗證 AI 聊天機器人提供的解答，確保客戶在詢問產品或服務相關問題時收到準確且值得信任的資訊。
醫療 QnA：針對醫療 QnA，該功能可協助驗證 AI 系統提供給醫療保健專業人員和病患之醫療解答和建議的正確性，降低醫療錯誤的風險。
教育 QnA：在教育情境中，該功能可應用在 QnA 工作，以確認學術問題或考試準備查詢的解答符合事實，進而在學習過程中提供支援。

根據性更正

根據性偵測 API 包含一項更正功能，可根據所提供的基礎來源，自動更正文字中任何偵測到的非根據性。啟用更正功能時，回應會包含 corrected Text 欄位，其中呈現與基礎來源對齊的更正文字。

使用案例

請參閱下面幾個常見的案例，了解如何及何時套用這些功能，以達到最佳結果。

醫學內容中的摘要

您正在摘要醫學文件，而且摘要中病患的名稱正確且與所提供的基礎來源一致至關重要。

API 要求範例：

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

預期結果：

更正功能會偵測到 Kevin 毫無根據，因為它與基礎來源 Jane 發生衝突。 API 會傳回更正的文字："The patient name is Jane."

客戶支援資料的問題與解答 (QnA) 工作

您正在為客戶支援聊天機器人實作 QnA 系統。 AI 所提供的解答必須與最新且正確的可用資訊保持一致。

API 要求範例：

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

預期結果：

API 會偵測到 5% 毫無根據，因為它不符合所提供的基礎來源 4.5%。回應包含更正文字："The interest rate is 4.5%."

使用歷史資料建立內容

您正在建立涉及歷程記錄數據或事件的內容，其中正確性對於維護信譽和避免錯誤信息至關重要。

API 要求範例：

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

預期結果：

API 會偵測到未設定的日期 1065 ，並根據地面來源將其更正 1066 。回應包含更正的文字："The Battle of Hastings occurred in 1066."

內部文件摘要

您正在摘要內部文件，其中產品名稱、版本號碼或其他特定資料點必須保持一致。

API 要求範例：

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

預期結果：

更正功能會 SuperWidget v2.1 識別為未設定前景，並在回應中將其更新為 SuperWidget v2.2 。回應會傳回更正的文字："Our latest product is SuperWidget v2.2."

最佳作法

在設定 RAG 系統以取得根據性偵測 API 的最佳效能時，請遵循下列最佳做法：

處理產品名稱或版本號碼時，請直接使用來自內部發行備註或官方產品文件的基礎來源，以確保正確性。
針對歷史內容，交叉參考您的基礎來源與受信任的學術或歷史資料庫，以確保最高層級的正確性。
在財務等動態環境中，一律使用最新且可靠的基礎來源，以確保 AI 系統提供正確且及時的資訊。
請務必確定您的基礎來源正確且為最新狀態，特別是在醫療保健等敏感性領域。這可將摘要程序中錯誤的風險降到最低。

限制

語言可用性

目前，根據性偵測 API 支援英語內容。雖然我們的 API 不會限制非英文內容的提交，但我們無法保證其他語言內容分析中的品質與正確性可達同一等級。我們建議使用者主要以英文提交內容，以確保 API 最可靠且最準確的結果。

文字長度限制

如需文字長度上限的資訊，請參閱輸入需求。

區域可用性

若要使用此 API，您必須在支援的區域中建立 Azure AI 內容安全資源。請參閱區域可用性 (英文)。

費率限制

請參閱查詢速率。

如果您需要更快的速率，請與我們連絡以提出要求。

下一步

請遵循快速入門以開始使用 Azure AI 內容安全來偵測根據性。

根據性偵測快速入門

共用方式為

基礎性偵測

關鍵字詞

根據性偵測選項

使用案例

根據性更正

使用案例

醫學內容中的摘要

客戶支援資料的問題與解答 (QnA) 工作

使用歷史資料建立內容

內部文件摘要

最佳作法

限制

語言可用性

文字長度限制

區域可用性

費率限制

下一步

意見反應

其他資源