Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Mosaik AI unterstützt sowohl einfache als auch komplexe KI-Anwendungen von Retrieval Augmented Generation (RAG)-Chatbots bis hin zu Tool-Calling-Agents. Lernen Sie die wichtigsten Konzepte von KI-Apps und Agent-Systemen der Generation kennen, erkunden Sie gängige Entwurfsmuster und erhalten Sie praktische Lernprogramme zum Erstellen, Auswerten und Skalieren von KI-Apps der Generation.
Lernen Sie die Konzepte von generativer KI-Apps kennen
Machen Sie sich mit grundlegenden KI-App-Konzepten der Generation vertraut.
Erfahren Sie, wie Mosaik AI wichtige Herausforderungen während der KI-Entwicklung behandelt.
- Wichtige Herausforderungen beim Erstellen von generativen KI-Apps
- Mosaik-KI-Funktionen für generative KI-Apps
Versuchen Sie, generative KI-Apps mit Mosaic AI zu erstellen
Beginnen Sie mit den folgenden Notebook-Tutorials:
- Erstellen und Bereitstellen Ihres ersten KI-Agents mit Agent Framework
- Bewertung eines KI-Agenten mit Agentenbewertung
Wenn Sie für mehr Komplexität bereit sind, lesen Sie die erweiterten Leitfäden und Lernprogramme:
Was sind generative KI-Apps?
Eine generative KI-App ist eine Anwendung, die generative KI-Modelle (z. B. LLMs, Bildgenerierungsmodelle und Text-zu-Sprache-Modelle) verwendet, um neue Ausgaben zu erstellen, komplexe Aufgaben zu automatisieren oder intelligente Interaktionen basierend auf Benutzereingaben durchzuführen. Während KI-Apps der Generation verschiedene Modelle verwenden können, konzentriert sich dieses Handbuch auf LLM-basierte Anwendungen.
Obwohl KI-Apps der LLM-Generation auf unterschiedliche Weise erstellt werden können, fallen sie in der Regel unter einem von zwei Architekturmustern:
Typ 1: Monolithisches LLM-System + Prompt | Typ 2 (empfohlen): Agentsystem | |
---|---|---|
Was ist es? | Ein einzelnes LLM mit sorgfältig gestalteten Eingabeaufforderungen. | Mehrere interagierende Komponenten (LLM-Aufrufe, Retriever, API-Aufrufe) gemeinsam orchestriert – von einfachen Ketten bis hin zu komplexen Multi-Agenten-Systemen. |
Beispielanwendungsfall | Inhaltsklassifizierung: Verwenden eines LLM zum Kategorisieren von Kundensupporttickets in vordefinierte Themen. | Intelligenter Assistent: Kombinieren von Dokumentabrufen, mehreren LLM-Aufrufen und externen APIs zum Recherchieren, Analysieren und Generieren umfassender Berichte. |
Am besten geeignet für | Einfache, fokussierte Aufgaben, schnelle Prototypen und klare, klar definierte Eingabeaufforderungen. | Komplexe Workflows, Aufgaben, die mehrere Funktionen erfordern, und Aufgaben, die Überlegungen zu vorherigen Schritten erfordern. |
Wichtige Vorteile | Einfachere Implementierung, schnellere Entwicklung und geringere betriebliche Komplexität. | Zuverlässiger und wartungsfähiger, bessere Kontrolle und Flexibilität, einfacher zu testen und zu überprüfen sowie und Optimierung auf Komponentenebene. |
Einschränkungen | Weniger flexibel, schwieriger zu optimieren und eingeschränkte Funktionalität. | Komplexere Implementierung, mehr anfängliches Setup und erfordert Komponentenkoordination. |
Für die meisten Unternehmensanwendungsfälle empfiehlt Databricks ein Agent-System. Durch das Aufteilen von Systemen in kleinere, klar definierte Komponenten können Entwickler die Komplexität besser verwalten und gleichzeitig ein hohes Maß an Kontrolle und Compliance beibehalten, die für Unternehmensanwendungen erforderlich sind.
Mosaic AI verfügt über Tools und Funktionen, die sowohl für monolithische Systeme als auch für Agentensysteme funktionieren. In der restlichen Dokumentation wird behandelt, wie beide Arten von generativen KI-Apps erstellt werden.
Weitere Informationen zur Theorie hinter Agent-Systemen im Vergleich zu monolithischen Modellen finden Sie in Blogbeiträgen der Databricks-Gründer:
- KI-Agent-Systeme: Modulares Engineering für zuverlässige KI-Anwendungen für Unternehmen
- Der Wechsel von Modellen zu Verbund-KI-Systemen
Was ist ein Agentsystem?
Ein Agent-System ist ein KI-gesteuertes System, das autonom erkennen, entscheiden und in einer Umgebung handeln kann, um Ziele zu erreichen. Im Gegensatz zu einem eigenständigen LLM, das nur bei Aufforderung eine Ausgabe erzeugt, verfügt ein Agentensystem über einen Grad an Eigenständigkeit. Moderne LLM-basierte Agentensysteme verwenden ein LLM als "Gehirn", um Kontext zu interpretieren, über die nächste Aktion nachzudenken und Aktionen wie API-Aufrufe, Abrufmechanismen und Toolaufrufe auszuführen, um Aufgaben zu erledigen.
Ein Agentsystem ist ein System mit einem LLM im Kern. Dieses System:
- Empfängt Benutzeranforderungen oder Nachrichten von einem anderen Agent.
- Gründe für die Vorgehensweise: welche Daten abgerufen werden sollen, welche Logik angewendet werden soll, welche Tools aufgerufen werden sollen oder ob mehr Eingaben vom Benutzer angefordert werden sollen.
- Führt einen Plan aus und ruft möglicherweise mehrere Tools auf oder delegiert an Unteragenten.
- Gibt eine Antwort zurück oder fordert den Benutzer zur zusätzlichen Klarstellung auf.
Durch die Überbrückung der allgemeinen Intelligenz (der vortrainierten Fähigkeiten des LLM) und der datenbezogenen Intelligenz (spezielle Kenntnisse und APIs für Ihr Unternehmen) ermöglichen Agentsysteme unternehmensweite Anwendungsfälle wie fortgeschrittene Kundenservice-Abläufe, datenreiche Analyse-Bots und die Orchestrierung von Multi-Agenten-Systemen für komplexe operative Aufgaben.
Was kann ein Agentsystem tun?
Ein Agentsystem kann:
- Dynamisches Planen von Aktionen
- Zustand von einem Schritt zum nächsten übertragen
- Passen Sie ihre Strategie basierend auf neuen Informationen ohne kontinuierliche menschliche Intervention an
Wenn ein eigenständiges LLM auf Anfrage eine Reiseroute ausgeben kann, kann ein Agent-System Kundeninformationen abrufen und die Flüge autonom buchen, durch die Nutzung von Tools und APIs. Durch die Kombination von "allgemeiner Intelligenz" aus dem LLM mit "Data Intelligence" (domänenspezifische Daten oder APIs) können Agentsysteme anspruchsvolle Unternehmensanwendungsfälle bewältigen, die ein einzelnes statisches Modell lösen würde.
Agentur ist kontinuum; je mehr Freiheit Sie Modelle bereitstellen, um das Verhalten des Systems zu steuern, desto agentischer wird die Anwendung. In der Praxis schränken die meisten Produktionssysteme die Autonomie des Agenten sorgfältig ein, um die Einhaltung und Vorhersagbarkeit zu gewährleisten, z. B. durch die Notwendigkeit einer menschlichen Genehmigung für riskante Maßnahmen.
Allgemeine Intelligenz im Vergleich zu Datenintelligenz
- Allgemeine Intelligenz: Bezieht sich auf das, was das LLM von Natur aus aus einem breiten Vortraining auf vielfältigem Text wissen kann. Dies ist nützlich für Sprachflüssigkeit und allgemeines Denken.
- Datenintelligenz: Bezieht sich auf die domänenspezifischen Daten und APIs Ihrer Organisation. Dies kann Kundendatensätze, Produktinformationen, Wissensdatenbanken oder Dokumente umfassen, die Ihre einzigartige Geschäftsumgebung widerspiegeln.
Agentsysteme verbinden diese beiden Perspektiven: Sie beginnen mit dem breiten, generischen Wissen eines LLM und bringen dann Echtzeit- oder domänenspezifische Daten ein, um detaillierte Fragen zu beantworten oder spezielle Aktionen auszuführen.
Beispiel-Agent-System
Betrachten Sie ein Callcenter-Szenario zwischen einem Kunden und einem generativen KI-Agenten.
Der Kunde stellt eine Anfrage: "Können Sie mir helfen, meine letzte Bestellung zurückzugeben?"
- Grund und Plan: Angesichts der Absicht der Abfrage plant der Agent: "Die letzte Bestellung des Benutzers nachschlagen und unsere Rückgaberichtlinie überprüfen."
- Informationen finden (Datenintelligenz): Der Agent fragt die Bestelldatenbank ab, um die relevante Bestellung abzurufen und konsultiert ein Richtliniendokument.
-
Grund: Der Agent überprüft, ob diese Reihenfolge in das Rückgabefenster passt.
- Optionaler Mensch in der Schleife: Der Agent überprüft eine zusätzliche Regel: Wenn das Element in eine bestimmte Kategorie fällt oder sich außerhalb des normalen Rückgabefensters befindet, eskalieren Sie an einen Menschen.
- Aktion: Der Agent löst den Rückgabevorgang aus und generiert ein Versandetikett.
- Grund: Der Agent generiert eine Antwort auf den Kunden.
Der KI-Agent antwortet auf den Kunden: "Fertig! Hier ist Ihr Versandetikett..."
Diese Schritte sind zweite Natur in einem menschlichen Callcenterkontext. In einem Agentensystem-Kontext zieht das LLM Schlüsse, während das System auf spezielle Tools oder Datenquellen zurückgreift, um die Details auszufüllen.
Komplexitätsstufen: Von LLMs zu Agentsystemen
Beim Erstellen von KI-Systemen können mehrere Komplexitätsstufen auftreten.
LLMs (LLM + Eingabeaufforderung)
- Ein eigenständiges LLM antwortet auf Textaufforderungen basierend auf Wissen aus einem umfangreichen Schulungsdatensatz.
- Gut für einfache oder generische Abfragen, aber häufig getrennt von Ihren realen Geschäftsdaten.
Hartcodiertes Agent-System ("Chain")
- Entwickler orchestrieren deterministische, vordefinierte Schritte. Beispielsweise kann eine RAG-Anwendung immer aus einem Vektorspeicher abrufen und die Ergebnisse mit der Benutzeraufforderung kombinieren.
- Die Logik ist behoben, und die LLM entscheidet nicht, welches Tool als nächstes aufgerufen werden soll.
Toolanruf-Agent-System
- Das LLM entscheidet, welches Tool zur Laufzeit verwendet werden soll und wann es verwendet werden soll.
- Dieser Ansatz unterstützt dynamische, kontextbezogene Entscheidungen darüber, welche Tools aufgerufen werden sollen, z. B. eine CRM-Datenbank oder eine Slack-Bereitstellungs-API.
Multi-Agent-Systeme
- Mehrere spezialisierte Agents, die jeweils über eine eigene Funktion oder Domäne verfügen.
- Ein Koordinator (manchmal ein KI-Vorgesetzter, manchmal regelbasiert) entscheidet, welcher Agent bei jedem Schritt aufgerufen werden soll.
- Agents können Aufgaben aneinander übergeben und gleichzeitig den gesamten Unterhaltungsfluss beibehalten.
Starten Sie beim Erstellen einer LLM-basierten Anwendung einfach. Führen Sie komplexere agentische Verhaltensweisen ein, wenn Sie sie wirklich für eine bessere Flexibilität oder modellgesteuerte Entscheidungen benötigen. Deterministische Ketten bieten vorhersehbare, regelbasierte Abläufe für gut definierte Aufgaben, während mehr agentische Ansätze zu Kosten zusätzlicher Komplexität und potenzieller Latenz kommen.
Mosaik AI Agent Framework ist für diese Muster agnostisch, wodurch es einfach ist, einfach zu beginnen und sich in Richtung höherer Automatisierungs- und Autonomiestufen zu entwickeln, während Ihre Anwendungsanforderungen wachsen.
Tools in einem Agentsystem
Im Kontext eines Agentsystems sind Tools Einzelinteraktionsfunktionen , die ein LLM aufrufen kann, um eine gut definierte Aufgabe auszuführen. Das KI-Modell generiert in der Regel Parameter für jeden Toolaufruf, und das Tool bietet eine einfache Eingabeausgabeinteraktion. Auf der Werkzeugseite ist kein Multi-Turn-Speicher vorhanden.
Einige gängige Toolkategorien umfassen:
-
Tools zum Abrufen oder Analysieren von Daten
- Vektorabruftools: Abfragen eines Vektorindexes, um die relevantesten Textblöcke zu finden.
- Strukturierte Abruftools: Abfragen von Delta-Tabellen oder Verwenden von APIs zum Abrufen strukturierter Informationen.
- Websuchtool: Durchsuchen Sie das Internet oder einen internen Webkorpus.
- Klassische ML-Modelle: Tools, die ML-Modelle aufrufen, um Klassifizierungs- oder Regressionsvorhersagen auszuführen, z. B. ein Scikit-Learn- oder XGBoost-Modell.
- Gen-KI-Modelle: Tools, die spezielle Generierungen ausführen, z. B. Code oder Bildgenerierung, und die Ergebnisse zurückgeben.
-
Tools zum Ändern des Zustands eines externen Systems
- API-Aufruftool: CRM-Endpunkte, interne Dienste oder andere Drittanbieterintegrationen für Aufgaben wie "Aktualisieren des Versandstatus".
- Codeausführungstool: Führt vom Benutzer bereitgestellten Code (oder in einigen Fällen LLM-generierten) Code in einem Sandkasten aus.
- Slack- oder E-Mail-Integration: Sendet eine Nachricht oder sendet eine Benachrichtigung.
-
Tools, die Logik ausführen oder eine bestimmte Aufgabe ausführen
- Codeausführertool: Führt vom Benutzer bereitgestellten oder LLM-generierten Code in einer Sandbox aus, z. B. Python-Skripts.
Weitere Informationen zu Mosaik KI-Agent-Tools finden Sie unter KI-Agent-Tools.
Wichtige Merkmale von Tools
Tools in einem Agentsystem:
- Führen Sie einen einzelnen, gut definierten Vorgang aus.
- Halten Sie keinen anhaltenden Kontext über diesen Aufruf hinaus aufrecht.
- Erlauben Sie dem Agentsystem, externe Daten oder Dienste zu erreichen, auf die die LLM nicht direkt zugreifen kann.
Toolfehlerbehandlung und Sicherheit
Da es sich bei jedem Toolaufruf um einen externen Vorgang handelt, z. B. das Aufrufen einer API, sollte das System Fehler ordnungsgemäß behandeln, z. B. Timeouts, Fehlerbehandlung falsch formatierter Antworten oder ungültige Eingaben. Beschränken Sie in der Produktion die Anzahl der zulässigen Toolaufrufe, weisen Sie eine Fallbackantwort auf, wenn alle Toolaufrufe fehlschlagen, und wenden Sie Schutzläufe an, um sicherzustellen, dass das Agentsystem nicht wiederholt dieselbe fehlerhafte Aktion versucht.