Azure Databricks 上的 RAG (檢索增強生成)

擷取增強生成（RAG）是一種強大的技術，結合了大型語言模型（LLM）與實時數據擷取，以產生更精確的up-to-date，以及內容相關的回應。

這種方法對於回答專屬、經常變更或領域特定資訊的問題特別有價值。

什麼是「檢索增強生成」？

最簡單的形式是RAG代理程式會執行下列動作：

RAG 應用程式的流程，從使用者要求至資料擷取和回應。

RAG 會以下列方式改善 LLM：

典型的 RAG 應用程式牽涉到數個階段：

數據管線：預先處理和編製文件、數據表或其他數據的索引，以快速且準確地擷取。
RAG 鏈結（擷取、擴增、生成）：執行一系列（或鏈結）步驟，以：
- 瞭解用戶的問題。
- 擷取支持的數據。
- 使用支援的數據增強提示。
- 使用擴充提示從 LLM 產生回應。
評估和監視：評估RAG應用程式以判斷其品質、成本和延遲，以確保其符合您的商務需求。
治理和 LLMOps：追蹤和管理每個元件的生命週期，包括資料譜系和存取控制。

RAG 應用程式元件的圖表。

RAG 架構可以搭配非結構化或結構化佐證資料使用。您搭配 RAG 使用的資料取決於您的使用案例。

非結構化資料： 沒有特定結構或組織的資料。

結構化數據： 以具有特定架構的數據列和數據行排列的表格式數據，例如資料庫中的數據表。

評估和監視有助於判斷 RAG 應用程式是否符合您的品質、成本和延遲需求。評估會在開發期間發生，而監視會在應用程式部署至生產環境時發生。

非結構化資料的 RAG 有許多影響品質的元件。例如，數據格式化變更可能會影響擷取的區塊，以及 LLM 產生相關回應的能力。因此，除了整體應用程式之外，請務必評估個別元件。

Databricks 提供用於 RAG 開發的端對端平臺，包括：

使用 Agent Bricks: Knowledge Assistant 建立 RAG 代理作為檔案上的聊天機器人，並作為可在下游應用程式中使用的端點。請參閱使用 Agent Bricks：知識助理，透過您的文件創建高品質的聊天機器人。