瞭解向量資料庫、檢索增強生成,以及 AI 中的內嵌

已完成

向量資料庫、內嵌和檢索增強生成 (RAG) 是增強 AI 驅動應用程式的重要技術,特別是在適用於以虛擬核心為基礎的 Azure Cosmos DB for MongoDB 內容中。 瞭解這些概念對於實作進階功能很重要,例如向量搜尋查詢您自己的資料。

瞭解 AI 中的內嵌

在討論向量資料庫或 RAG 系統之前,我們需要瞭解 AI 應用程式中的內嵌及其角色。 內嵌會將單字、句子或整個文件等項目轉換成反映其意義的數值向量。 例如,代表「貓 (cat)」一字的向量可能以下列方式表示:

[0.1, 0.2, 0.3, 0.4, 0.5]

這些向量透過機器學習技術所建立,可協助 AI 模型更有效率地瞭解和使用資料。 然後,AI 模型可以使用這些向量來執行分類、叢集或類似性比對等工作。 它們對於從文字分析到電腦視覺、支援分類文字或產生影像和程式碼等工作,在應用程式中扮演著重要角色。

在 Azure OpenAI 之類的平臺中,內嵌是協助大型語言模型處理及產生文字以反映人類通訊的關鍵。 它們會將複雜的資料轉換成模型可用以作業的結構化形式,增強模型產生相關且一致的回應之能力。 內嵌對於向量資料庫而言也很重要,這些資料庫會根據這些數值表示來儲存和擷取資料。

探索向量資料庫

向量中的每個值都會被視為其所代表資料的維度。 接著,該向量會代表其在高度多維度空間中相對於所有其他向量的位置。 這些向量通常有許多維度,其中一些 Azure OpenAI 中的「較小」的內嵌模型具有 1536 維度。

向量資料庫會將資料儲存為透過轉換或內嵌從文字、影像或影片等各種資料類型建立的高度多維度向量。 這些資料庫擅長快速尋找語意相符的資料,而不只是透過確切的查詢。 此功能對於尋找類似影像、文件或產品等應用程式而言相當重要。

例如,在向量資料庫中,您可以使用影像或文字片段做為查詢,來搜尋其他樣式或內容相符的項目。 此程序涉及尋找搜尋輸入的查詢向量(內嵌),並使用相似性量值,例如 餘弦相似度歐幾里得距離 來尋找向量之間的距離。

因此,如果您搜尋「貓 (cat)」這個字,資料庫便會根據使用的相似性量值,傳回最類似「貓 (cat)」這個字的向量。 這些相似性量值依賴轉換或內嵌,以根據它們與查詢的相符程度來排名結果。

向量資料庫可以是檢索增強生成 (RAG) 系統的基本元件,其會在該系統中儲存和擷取 AI 模型的資料,以產生回應。 藉由使用向量資料庫,您可以確保 AI 模型根據相關且具內容意識的資料,擷取和產生回應,以增強回應的精確度和相關性。

探索檢索增強生成 (RAG)

RAG 系統可藉由新增資訊擷取系統,來改善大型語言模型。 此系統會針對相關、特定資料進行 AI 回應,例如從企業中的資料建立的向量化文件和影像。

使用向量資料庫的 RAG 系統通常會遵循下列步驟:

  1. 內嵌輸入問題或查詢,並從向量資料庫擷取相關資料。
  2. 產生提示,包括初始輸入,以及擷取以提供內容的資料。
  3. 使用合併的提示,來查詢生成式 AI 模型,以產生回應。

檢索增強生成系統的圖表。

整合 RAG 系統可讓您精確控制語言模型使用的資料,使其回應更精確且訂製化。 與包含資料的向量資料庫連結時,AI 模型可以使用您的資料、改善其回應,並讓這些回應更適用於您的企業並對其更具有內容意識。

在 RAG 系統中,AI 應用程式由您的資料訂製和管理,而非相反的作業方式。

向量資料庫、內嵌和檢索增強生成 (RAG) 對於增強 AI 驅動應用程式而言非常重要,特別是針對以虛擬核心為基礎的 Azure Cosmos DB for MongoDB 和 Azure OpenAI。 內嵌會將複雜的資料轉譯成數值向量,以改善 AI 模型的理解,這對文字分類和資料擷取等工作至關重要。 向量資料庫會使用這些內嵌來執行快速的語意驅動搜尋,以大幅增強資料擷取功能。 當您將這些技術結合到 RAG 系統中時,它們可讓 AI 提供不僅精確且專為特定資料訂製的回應,同時改善應用程式的相關性和有效性。