你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

有据性检测

2025-05-02

有据性检测功能检测大型语言模型 (LLM) 的文本响应是否以用户提供的源材料为依据。无据性是指 LLM 生成的信息与源材料中的信息不符或不准确。

关键术语

检索增强生成 (RAG)：RAG 是一种利用其他数据增强 LLM 知识的技术。 LLM 可以推理广泛的主题，但其知识仅限于在训练时可用的公共数据。如果想要构建能够推理专用数据或模型截止日期后引入的数据的 AI 应用程序，需要向模型提供该特定信息。引入相应的信息并将其插入模型提示的过程称为“检索增强生成 (RAG)”。有关详细信息，请参阅检索增强生成 (RAG)。
LLM 中的有据性和无据性：是指模型的输出基于所提供的信息或准确反映可靠来源的程度。有据响应与给定的信息密切相关，避免猜测或捏造。在有据性度量中，源信息至关重要，并充当有据源。

用户方案

有据性检测支持基于文本的摘要和 QnA 任务，以确保生成的摘要或答案准确可靠。

摘要任务：

医疗摘要：在医疗新闻文章中，可以使用有据性检测来确保摘要中不包含捏造或误导性信息，保证读者获得准确可靠的医疗信息。
学术论文摘要：当模型生成学术论文或研究文章的摘要时，此功能可以帮助确保摘要内容准确地代表重要发现和贡献，而不会引入虚假声明。

QnA 任务：

客户支持聊天机器人：在客户支持中，此功能可用于验证 AI 聊天机器人提供的答案，确保客户在询问有关产品或服务的问题时获得准确且可信的信息。
医疗 QnA：对于医疗 QnA，此功能有助于验证 AI 系统向医护人员和患者提供的医疗答案和建议的准确性，从而降低医疗错误的风险。
教育 QnA：在教育环境中，此功能可以应用于 QnA 任务，以确认学术问题或备考查询的答案准确，在学习过程中提供支持。

下面，请查看几个常见场景，它们描述了如何以及何时应用这些功能来实现最佳结果。

医学语境中的汇总

你正在汇总医学文档，摘要中患者姓名准确且与提供的基础源一致至关重要。

示例 API 请求：

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

预期结果：

纠正功能检测到 Kevin 上下文不关联，因为它与基础源 Jane 冲突。 API 返回纠正后的文本："The patient name is Jane."

使用客户支持数据的问答 (QnA) 任务

你正在为客户支持聊天机器人实现 QnA 系统。 AI 提供的答案与最新、准确的可用信息保持一致，这一点至关重要。

示例 API 请求：

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

预期结果：

该 API 检测到 5% 未接地，因为它与所提供的接地源 4.5% 不匹配。答复包含纠正文本："The interest rate is 4.5%."

使用历史数据创建内容

你正在创建涉及历史数据或事件的内容，为了保持可信度和避免信息错误，准确性至关重要。

示例 API 请求：

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

预期结果：

API 会检测无依据日期 1065，并根据依据源将其更正为 1066。答复包含纠正后的文本："The Battle of Hastings occurred in 1066."

内部文档汇总

你正在汇总内部文档，其中产品名称、版本号或其他特定数据点必须保持一致。

示例 API 请求：

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

预期结果：

更正功能将 SuperWidget v2.1 标识为“无依据”，并在响应中将其更新为 SuperWidget v2.2。答复返回纠正后的文本："Our latest product is SuperWidget v2.2."