使用 Azure Databricks 实现检索增强生成 (RAG)

中级
数据工程师
Azure Databricks

检索增强生成 (RAG) 是自然语言处理中的一种高级技术,它通过集成外部信息检索机制来提升生成模型的功能。 使用生成式模型和检索系统时,RAG 可动态地从外部数据源提取相关信息,以增强生成过程,从而产出更准确且与上下文紧密相关的输出结果。

学习目标

在本模块中,你将了解如何:

  • 设置 RAG 工作流。
  • 为 RAG 准备数据。
  • 使用矢量搜索检索相关文档。
  • 通过重新排序搜索结果来提高模型准确性。

先决条件

在开始学习本模块之前,你应该熟悉 Azure Databricks。 在开始本模块之前,请考虑完成浏览 Azure Databricks