Delen via


Augmented Generation (RAG) ophalen in Azure Cosmos DB

Het ophalen van Augmented Generation (RAG) combineert de kracht van grote taalmodellen (LLM's) met robuuste systemen voor het ophalen van informatie om nauwkeurigere en contextuele relevante antwoorden te creëren. In tegenstelling tot traditionele generatieve modellen die uitsluitend afhankelijk zijn van vooraf getrainde gegevens, verbeteren RAG-architecturen de mogelijkheden van een LLM door realtime informatie te integreren. Deze uitbreiding zorgt ervoor dat reacties niet alleen generatief zijn, maar ook worden geaard in de meest relevante, actuele gegevens die beschikbaar zijn.

Azure Cosmos DB, een operationele database die vectorzoekopdrachten ondersteunt, onderscheidt zich als een uitstekend platform voor het implementeren van RAG. De mogelijkheid om zowel operationele als analytische workloads in één database te verwerken, samen met geavanceerde functies zoals multitenancy en hiërarchische partitiesleutels, biedt een solide basis voor het bouwen van geavanceerde generatieve AI-toepassingen.

Belangrijkste voordelen van het gebruik van Azure Cosmos DB

Geïntegreerde gegevensopslag en ophalen

Azure Cosmos DB maakt naadloze integratie van vectorzoekmogelijkheden mogelijk binnen een geïntegreerd databasesysteem. Dit betekent dat uw operationele gegevens en gevectoriseerde gegevens naast elkaar bestaan, waardoor er geen afzonderlijke indexeringssystemen meer nodig zijn.

Realtime gegevensopname en query's uitvoeren

Azure Cosmos DB biedt ondersteuning voor realtime opname en query's, waardoor het ideaal is voor AI-toepassingen. Dit is van cruciaal belang voor RAG-architecturen, waarbij de versheid van gegevens aanzienlijk van invloed kan zijn op de relevantie van gegenereerde antwoorden.

Schaalbaarheid en wereldwijde distributie

Azure Cosmos DB is ontworpen voor grootschalige toepassingen en biedt wereldwijde distributie en directe automatische schaalaanpassing. Dit zorgt ervoor dat uw RAG-toepassing grote queryvolumes kan verwerken en consistente prestaties kan leveren, ongeacht de locatie van de gebruiker.

Hoge beschikbaarheid en betrouwbaarheid

Azure Cosmos DB biedt uitgebreide SLA's voor doorvoer, latentie en beschikbaarheid. Deze betrouwbaarheid zorgt ervoor dat uw RAG-systeem altijd beschikbaar is om reacties te genereren met minimale downtime.

Multitenancy met hiërarchische partitiesleutels

Azure Cosmos DB ondersteunt multitenancy via verschillende modellen voor prestatie- en beveiligingsisolatie, waardoor het eenvoudiger is om gegevens voor verschillende clients of gebruikersgroepen in dezelfde database te beheren. Deze functie is met name handig voor SaaS-toepassingen waarbij scheiding van tenantgegevens cruciaal is voor beveiliging en naleving.

Uitgebreide beveiligingsfuncties

Met ingebouwde functies zoals end-to-end-versleuteling, op rollen gebaseerd toegangsbeheer (RBAC) en VNet-integratie (virtueel netwerk), zorgt Azure Cosmos DB ervoor dat uw gegevens veilig blijven. Deze beveiligingsmaatregelen zijn essentieel voor RAG-toepassingen op bedrijfsniveau die gevoelige informatie verwerken.

RAG implementeren met Azure Cosmos DB

Tip

Voor RAG-voorbeelden gaat u naar: AzureDataRetrievalAugmentedGenerationSamples

Hier volgt een gestroomlijnd proces voor het bouwen van een RAG-toepassing met Azure Cosmos DB:

  1. Gegevensopname: sla uw documenten, afbeeldingen en andere inhoudstypen op in Azure Cosmos DB. Gebruik de ondersteuning van de database voor vectorzoekopdrachten om vectorinhoud te indexeren en op te halen.

  2. Queryuitvoering: Wanneer een gebruiker een query verzendt, kan Azure Cosmos DB snel de meest relevante gegevens ophalen met behulp van de vectorzoekmogelijkheden.

  3. LLM-integratie: geef de opgehaalde gegevens door aan een LLM (bijvoorbeeld Azure OpenAI) om een antwoord te genereren. De goed gestructureerde gegevens van Cosmos DB verbeteren de kwaliteit van de uitvoer van het model.

  4. Antwoordgeneratie: de LLM verwerkt de gegevens en genereert een uitgebreid antwoord, dat vervolgens aan de gebruiker wordt geleverd.