Grundlegendes zu Retrieval Augmented Generation (RAG) mit Azure OpenAI
RAG mit Azure OpenAI ermöglicht Entwicklern die Verwendung unterstützter KI-Chatmodelle, die auf bestimmte Informationsquellen verweisen können, um die Antwort zu unterstützen. Durch Das Hinzufügen dieser Informationen kann das Modell sowohl auf die angegebenen Daten als auch auf das vortrainierte Wissen verweisen, um effektivere Antworten bereitzustellen.
Azure OpenAI ermöglicht RAG, indem vortrainierte Modelle mit Ihren eigenen Datenquellen verbunden werden. Azure OpenAI für Ihre Daten nutzt die Suchfunktion von Azure AI Search, um der Eingabeaufforderung die relevanten Datenblöcke hinzuzufügen. Sobald sich Ihre Daten in einem KI-Suchindex befinden, durchläuft Azure OpenAI für Ihre Daten die folgenden Schritte:
- Benutzeraufforderung empfangen.
- Bestimmen Sie den relevanten Inhalt und die Absicht der Aufforderung.
- Fragen Sie den Suchindex mit diesen Inhalten und dieser Zielsetzung ab.
- Fügen Sie den Suchergebnisblock zusammen mit der Systemnachricht und der Benutzeraufforderung in die Azure OpenAI-Eingabeaufforderung ein.
- Senden Sie die gesamte Eingabeaufforderung an Azure OpenAI.
- Gibt die Antwort und den Datenverweis (falls vorhanden) an den Benutzer zurück.
Standardmäßig fördert Azure OpenAI die Nutzung Ihrer Daten, erfordert jedoch nicht, dass das Modell ausschließlich mit Ihren Daten reagiert. Diese Einstellung kann beim Verbinden Ihrer Daten deaktiviert werden, was dazu führen kann, dass das Modell sein vortrainiertes Wissen über Ihre Daten verwendet.
Feinabstimmung und RAG
Feinabstimmung ist eine Technik, die zum Erstellen eines benutzerdefinierten Modells verwendet wird, indem ein vorhandenes Grundmodell, wie z. B. gpt-35-turbo
, mit einem Datensatz zusätzlicher Schulungsdaten trainiert wird. Die Feinabstimmung kann zu hochwertigeren Anforderungen als nur mit Prompt Engineering führen, das Modell an Beispiele anpassen, deren Größe die Kapazität eines Prompts übersteigt, und es dem Benutzer ermöglichen, weniger Beispiele anzugeben, um die gleiche hochwertige Antwort zu erhalten. Der Prozess für die Feinabstimmung ist jedoch sowohl kostspielig als auch zeitintensiv und sollte nur für Anwendungsfälle verwendet werden, in denen es erforderlich ist.
RAG mit Azure OpenAI für Ihre Daten verwendet weiterhin die zustandslose API, um eine Verbindung mit dem Modell herzustellen, wodurch die Anforderung der Schulung eines benutzerdefinierten Modells mit Ihren Daten entfernt und die Interaktion mit dem KI-Modell vereinfacht wird. AI Search findet zuerst die nützlichen Informationen, um die Eingabeaufforderung zu beantworten, fügt diese Informationen dann der Eingabeaufforderung als Erdungsdaten hinzu, und Azure OpenAI bildet dann die Antwort basierend auf diesen Informationen.