RAG (Retrieval Augmented Generation) op Azure Databricks

2025-06-11

Rag (Retrieval-augmented generation) is een krachtige techniek die grote taalmodellen (LLM's) combineert met realtime gegevens ophalen om nauwkeurigere, up-to-date en contextafhankelijke relevante antwoorden te genereren.

Deze benadering is vooral waardevol voor het beantwoorden van vragen over bedrijfseigen, vaak veranderende of domeinspecifieke informatie.

Wat is het ophalen van augmented generation?

In de eenvoudigste vorm doet een RAG-agent het volgende:

Ophalen: de aanvraag van de gebruiker wordt gebruikt om een query uit te voeren op een externe knowledge base, zoals een vectorarchief, trefwoordzoekopdrachten of SQL-database. Het doel is om ondersteunende data te verzamelen ten behoeve van het antwoord van de LLM.
Uitbreiding: De ondersteunende gegevens worden gecombineerd met de aanvraag van de gebruiker, vaak met behulp van een sjabloon met aanvullende opmaak en instructies voor de LLM, om een prompt te maken.
Generatie: de prompt wordt doorgegeven aan de LLM om een antwoord te genereren op de aanvraag van de gebruiker.

De stroom van een RAG-toepassing van gebruikersaanvraag naar het ophalen en reageren van gegevens.

RAG-voordelen

RAG verbetert LLM's op de volgende manieren:

Eigen kennis: RAG kan eigendomsinformatie bevatten die niet in eerste instantie wordt gebruikt voor het trainen van de LLM, zoals memo's, e-mailberichten en documenten om domeinspecifieke vragen te beantwoorden.
Actuele informatie: Een RAG-toepassing kan de LLM voorzien van informatie uit een bijgewerkte knowledge base.
Bronvermeldingen: MET RAG kunnen LLM's specifieke bronnen citeren, zodat gebruikers de feitelijke nauwkeurigheid van reacties kunnen controleren.
ACL's (Data Security and Access Control Lists): De ophaalstap kan worden ontworpen om selectief persoonlijke of bedrijfseigen gegevens op te halen op basis van gebruikersreferenties.

RAG-onderdelen

Een typische RAG-toepassing omvat verschillende fasen:

Gegevenspijplijn: documenten, tabellen of andere gegevens vooraf verwerken en indexeren voor snelle en nauwkeurige ophaalbewerking.
RAG-keten (ophalen, augmentatie, generatie): roep een reeks (of keten) met stappen aan om:
- De vraag van de gebruiker begrijpen.
- Ondersteunende gegevens ophalen.
- Breid de prompt uit met ondersteunende gegevens.
- Genereer een antwoord van een LLM met behulp van de verrijkte prompt.
Evaluatie en bewaking: Evalueer de RAG-toepassing om de kwaliteit, kosten en latentie te bepalen om ervoor te zorgen dat deze voldoet aan uw bedrijfsvereisten.
Governance en LLMOps: de levenscyclus van elk onderdeel bijhouden en beheren, inclusief gegevensherkomst en toegangsbeheer.

Diagram van RAG-toepassingsonderdelen.

Typen RAG-gegevens: gestructureerd en ongestructureerd

Rag-architectuur kan werken met niet-gestructureerde of gestructureerde ondersteunende gegevens. De gegevens die u met RAG gebruikt, zijn afhankelijk van uw use-case.

Ongestructureerde gegevens: gegevens zonder een specifieke structuur of organisatie.

PDF-bestanden
Google/Office-documenten
Wikia
Afbeeldingen
Video's

gestructureerde gegevens: tabelgegevens gerangschikt in rijen en kolommen met een specifiek schema, zoals tabellen in een database.

Klantrecords in een BI- of Data Warehouse-systeem
Transactiegegevens uit een SQL-database
Gegevens uit toepassings-API's (bijvoorbeeld SAP, Salesforce, enzovoort)

Evaluatie en monitoring

Met evaluatie en bewaking kunt u bepalen of uw RAG-toepassing voldoet aan uw vereisten voor kwaliteit, kosten en latentie. Evaluatie vindt plaats tijdens de ontwikkeling, terwijl de bewaking plaatsvindt zodra de toepassing in productie is geïmplementeerd.

RAG over ongestructureerde gegevens heeft veel onderdelen die van invloed zijn op de kwaliteit. Wijzigingen in gegevensopmaak kunnen bijvoorbeeld van invloed zijn op de opgehaalde segmenten en de mogelijkheid van de LLM om relevante antwoorden te genereren. Het is dus belangrijk om afzonderlijke onderdelen naast de algehele toepassing te evalueren.

Zie Mosaic AI Agent Evaluation (MLflow 2) voor meer informatie.

RAG op Databricks

Databricks biedt een end-to-end-platform voor RAG-ontwikkeling, waaronder:

Geïntegreerde gegevenspijplijnen met Delta Lake en Lakeflow declaratieve pijplijnen
Schaalbare vectorzoekopdrachten met Databricks Vector Search
Hulpprogramma's voor het leveren en organiseren van modellen
Gen AI-evaluatie om de prestaties en kwaliteit te verbeteren
Gen AI-bewaking voor geïmplementeerde RAG-toepassingen
Ingebouwde governance en beveiliging, zie Security and Trust Center en AI Gateway.

Volgende stappen

Meer informatie over gegevenspijplijnen, een belangrijk onderdeel van RAG-toepassingen. Zie Een ongestructureerde gegevenspijplijn bouwen voor RAG
Gebruik de AI Playground om uw eigen RAG-agent te prototypen. Zie prototype-tooloproepagenten in de AI Playground.

Agent Bricks gebruiken: Knowledge Assistant maakt een RAG-agent als chatbot op uw documenten en als eindpunt dat u in downstreamtoepassingen kunt gebruiken. Zie Agent Bricks gebruiken: Knowledge Assistant voor het maken van een chatbot van hoge kwaliteit over uw documenten.