Begrijp Retrieval Augmented Generation (RAG) met Azure OpenAI

Voltooid

RAG met Azure OpenAI stelt ontwikkelaars in staat om ondersteunde AI-chatmodellen te gebruiken die kunnen verwijzen naar specifieke informatiebronnen om het antwoord te gronden. Door deze informatie toe te voegen, kan het model verwijzen naar zowel de specifieke gegevens als de vooraf getrainde kennis om effectievere antwoorden te bieden.

Azure OpenAI maakt RAG mogelijk door vooraf getrainde modellen te verbinden met uw eigen gegevensbronnen. Azure OpenAI op uw gegevens maakt gebruik van de zoekfunctie van Azure AI Search om de relevante gegevenssegmenten toe te voegen aan de prompt. Zodra uw gegevens zich in een AI Search-index bevindt, voert Azure OpenAI voor uw gegevens de volgende stappen uit:

  1. Gebruikersprompt ontvangen.
  2. Bepaal relevante inhoud en intentie van de prompt.
  3. Voer een query uit op de zoekindex met die inhoud en intentie.
  4. Voeg het zoekresultaatsegment in de Azure OpenAI-prompt in, samen met het systeembericht en de gebruikersprompt.
  5. Volledige prompt verzenden naar Azure OpenAI.
  6. Antwoord en gegevensreferentie (indien aanwezig) retourneren aan de gebruiker.

Azure OpenAI op uw gegevens moedigt standaard aan, maar vereist niet, het model om alleen te reageren met behulp van uw gegevens. Deze instelling kan niet worden geselecteerd bij het verbinden van uw gegevens. Dit kan ertoe leiden dat het model ervoor kiest om de vooraf getrainde kennis over uw gegevens te gebruiken.

Fine-tuning versus RAG

Verfijning is een techniek die wordt gebruikt om een aangepast model te maken door een bestaand basismodel te trainen, zoals gpt-35-turbo met een gegevensset met aanvullende trainingsgegevens. Het afstemmen kan leiden tot aanvragen van hogere kwaliteit dan alleen prompt engineering, het model aanpassen op voorbeelden die groter zijn dan in een prompt passen en de gebruiker in staat stellen minder voorbeelden te geven om dezelfde respons van hoge kwaliteit te krijgen. Het proces voor het afstemmen is echter zowel kostbaar als tijdrovend en mag alleen worden gebruikt voor gebruiksscenario's waar dat nodig is.

RAG met Azure OpenAI op uw gegevens maakt nog steeds gebruik van de stateless API om verbinding te maken met het model, waardoor de vereiste voor het trainen van een aangepast model met uw gegevens wordt verwijderd en de interactie met het AI-model wordt vereenvoudigd. AI Search vindt eerst de nuttige informatie om de prompt te beantwoorden. Vervolgens wordt die informatie aan de prompt toegevoegd als grondgegevens. Azure OpenAI vormt vervolgens het antwoord op basis van die informatie.