Läs på engelska

Dela via


Hämtning av utökad generation (RAG) i Azure Cosmos DB

RAG (Retrieval Augmented Generation) kombinerar kraften i stora språkmodeller (LLM: er) med robusta informationshämtningssystem för att skapa mer exakta och sammanhangsberoende relevanta svar. Till skillnad från traditionella generativa modeller som enbart förlitar sig på förtränade data, förbättrar RAG-arkitekturer en LLM-funktioner genom att integrera informationshämtning i realtid. Den här förstoringen säkerställer att svaren inte bara är generativa utan även baseras på de mest relevanta, uppdaterade data som är tillgängliga.

Azure Cosmos DB, en driftdatabas som stöder vektorsökning, utmärker sig som en utmärkt plattform för implementering av RAG. Dess förmåga att hantera både operativa och analytiska arbetsbelastningar i en enda databas, tillsammans med avancerade funktioner som flera klient- och hierarkiska partitionsnycklar, ger en solid grund för att skapa avancerade generativa AI-program.

Viktiga fördelar med att använda Azure Cosmos DB

Enhetlig datalagring och hämtning

Azure Cosmos DB möjliggör sömlös integrering av vektorsökningsfunktioner i ett enhetligt databassystem. Det innebär att dina driftdata och vektoriserade data samexisterar, vilket eliminerar behovet av separata indexeringssystem.

Datainmatning och frågor i realtid

Azure Cosmos DB stöder inmatning och frågor i realtid, vilket gör det idealiskt för AI-program. Detta är avgörande för RAG-arkitekturer, där datas färskhet avsevärt kan påverka relevansen av genererade svar.

Skalbarhet och global distribution

Azure Cosmos DB är utformat för storskaliga program och erbjuder global distribution och snabb autoskalning. Detta säkerställer att ditt RAG-aktiverade program kan hantera höga frågevolymer och leverera konsekventa prestanda oavsett användarens plats.

Hög tillgänglighet och tillförlitlighet

Azure Cosmos DB erbjuder omfattande serviceavtal för dataflöde, svarstid och tillgänglighet. Den här tillförlitligheten säkerställer att DITT RAG-system alltid är tillgängligt för att generera svar med minimal stilleståndstid.

Flera klientorganisationer med hierarkiska partitionsnycklar

Azure Cosmos DB stöder flera klientorganisationer via olika prestanda- och säkerhetsisoleringsmodeller, vilket gör det enklare att hantera data för olika klienter eller användargrupper i samma databas. Den här funktionen är särskilt användbar för SaaS-program där separation av klientdata är avgörande för säkerhet och efterlevnad.

Omfattande säkerhetsfunktioner

Med inbyggda funktioner som kryptering från slutpunkt till slutpunkt, rollbaserad åtkomstkontroll (RBAC) och integrering av virtuella nätverk (VNet) ser Azure Cosmos DB till att dina data förblir säkra. Dessa säkerhetsåtgärder är viktiga för RAG-program i företagsklass som hanterar känslig information.

Implementera RAG med Azure Cosmos DB

Tips

Information om RAG-exempel finns i: AzureDataRetrievalAugmentedGenerationSamples

Här är en effektiv process för att skapa ett RAG-program med Azure Cosmos DB:

  1. Datainmatning: Lagra dokument, bilder och andra innehållstyper i Azure Cosmos DB. Använd databasens stöd för vektorsökning för att indexeras och hämta vektoriserat innehåll.
  2. Frågekörning: När en användare skickar en fråga kan Azure Cosmos DB snabbt hämta de mest relevanta data med hjälp av dess vektorsökningsfunktioner.
  3. LLM-integrering: Skicka hämtade data till en LLM (t.ex. Azure OpenAI) för att generera ett svar. De välstrukturerade data som tillhandahålls av Cosmos DB förbättrar kvaliteten på modellens utdata.
  4. Svarsgenerering: LLM bearbetar data och genererar ett omfattande svar som sedan levereras till användaren.