共用方式為


Azure Cosmos DB 中的擷取擴增生成 (RAG)

擷取擴增生成 (RAG) 結合了大型語言模型 (LLM) 的強大功能與健全的資訊擷取系統,以建立更精確且內容相關的回應。 不同於僅依賴預先定型資料的傳統生成模型,RAG 架構會整合即時資訊擷取來強化 LLM 的功能。 此擴增可確保回應不僅具有生成性,而且會以最相關的最新資料為基礎。

支援向量搜尋的操作資料庫 Azure Cosmos DB 脫穎而出,成為實作 RAG 的絕佳平台。 其處理單一資料庫中作業和分析工作負載的能力,以及多租用戶和階層式資料分割索引鍵等進階功能,為建置複雜的生成式 AI 應用程式提供了堅實的基礎。

使用 Azure Cosmos DB 的主要優點

整合資料儲存和擷取

Azure Cosmos DB 可讓您在統整的資料庫系統中,順暢無縫地整合向量搜尋功能。 這表示您的作業資料和向量化資料並存,不需要再維護個別的編製索引系統。

即時資料擷取和查詢

Azure Cosmos DB 支援即時資料擷取和查詢,使其非常適合 AI 應用程式。 這對 RAG 架構而言非常重要,因為資料的新鮮度可能會大幅影響所產生回應的相關性。

延展性和全域分配

Azure Cosmos DB 專為大規模應用程式而設計,可提供全域分配和立即自動調整。 這可確保啟用 RAG 的應用程式可以處理高查詢量,並為所有使用者位置提供一致的效能。

高可用性與穩定性

Azure Cosmos DB 為輸送量、延遲和可用性提供完整的 SLA。 此可靠性可確保您的 RAG 系統隨時可供使用,並能以最短停機時間產生回應。

具有階層式資料分割索引鍵的多租用戶

Azure Cosmos DB 透過各種效能和安全性隔離模型支援多租用戶管理功能,讓您更輕鬆地管理相同資料庫中不同用戶端或使用者群組的資料。 這項功能特別適用於 SaaS 應用程式,其中租用戶資料區隔對於安全性和合規性至關重要。

完善的安全性功能

Azure Cosmos DB 使用端對端加密、角色型存取控制 (RBAC) 和虛擬網路 (VNet) 整合等內建功能,確保您的資料安全無虞。 對於處理敏感性資訊的企業級 RAG 應用程式而言,這些安全性措施至關重要。

使用 Azure Cosmos DB 實作 RAG

提示

如需 RAG 範例,請前往:AzureDataRetrievalAugmentedGenerationSamples

以下是使用 Azure Cosmos DB 建置 RAG 應用程式的簡化程序:

  1. 資料擷取:將您的文件、影像和其他內容類型儲存在 Azure Cosmos DB 中。 利用資料庫對向量搜尋的支援,來編製索引及擷取向量化內容。

  2. 查詢執行:當使用者提交查詢時,Azure Cosmos DB 可以使用其向量搜尋功能快速擷取最相關的資料。

  3. LLM 整合:將擷取的資料傳遞至 LLM (例如 Azure OpenAI),以產生回應。 Cosmos DB 所提供的結構化資料可強化模型輸出的品質。

  4. 回應生成:LLM 會處理資料併產生完整的回應,然後傳遞給使用者。