Informazioni su RAG (Retrieval Augmented Generation) con il Servizio OpenAI di Azure

Completato

RAG con OpenAI di Azure consente agli sviluppatori di usare modelli di chat di intelligenza artificiale supportati che possono fare riferimento a origini specifiche di informazioni per motivare la risposta. L'aggiunta di queste informazioni consente al modello di fare riferimento ai dati specifici forniti e alle relative conoscenze pre-addestrati per fornire risposte più efficaci.

OpenAI di Azure abilita RAG connettendo i modelli con training preliminare alle proprie origini dati. L'applicazione di OpenAI di Azure sui dati sfrutta la capacità di ricerca di Azure AI Search di aggiungere i blocchi di dati pertinenti al prompt. Quando i dati si trovano in un indice di AI Search, OpenAI di Azure esegue i passaggi seguenti sui dati:

  1. Ricevere una richiesta dell'utente.
  2. Determinare il contenuto e la finalità pertinenti della richiesta.
  3. Eseguire una query sull'indice di ricerca con tale contenuto e finalità.
  4. Inserire il blocco dei risultati della ricerca nel prompt di Azure OpenAI, insieme al messaggio di sistema e alla richiesta dell'utente.
  5. Inviare l'intero prompt ad Azure OpenAI.
  6. Restituisce la risposta e il riferimento ai dati (se presenti) all'utente.

Per impostazione predefinita, Azure OpenAI sui dati incoraggia, ma non richiede, il modello risponde solo usando i dati. Questa impostazione può essere deselezionata quando si connettono i dati, il che può comportare la scelta del modello di usare le proprie conoscenze pre-training sui dati.

Ottimizzazione vs. RAG

L'ottimizzazione è una tecnica usata per creare un modello personalizzato eseguendo il training di un modello di base esistente, ad esempio gpt-35-turbo con un set di dati di training aggiuntivi. L'ottimizzazione può comportare richieste di qualità superiore rispetto alla sola progettazione, personalizzando il modello su esempi di dimensioni superiori a quelle che possono rientrare in un prompt e consentendo all'utente di fornire meno esempi per ottenere la stessa risposta di alta qualità. Tuttavia, il processo per l'ottimizzazione è sia costoso che intensivo del tempo e deve essere usato solo per i casi d'uso in cui è necessario.

L'applicazione di RAG con OpenAI di Azure sui dati sfrutta ancora l'API senza stato per connettersi al modello, rimuove ndoil requisito di eseguire il training di un modello personalizzato con i dati e semplificando l'interazione con il modello di intelligenza artificiale. AI Search trova innanzitutto le informazioni utili per rispondere al prompt, le aggiunge al prompt come dati di base e OpenAI di Azure forma la risposta in base a tali informazioni.