Grundlegendes zu KI-Agents von Microsoft Agent Framework
Ein KI-Agent ist ein Programm, das generative KI verwendet, um Daten zu interpretieren, Entscheidungen zu treffen und Aufgaben im Auftrag von Benutzern oder anderen Anwendungen auszuführen. KI-Agents verlassen sich auf große Sprachmodelle, um ihre Aufgaben auszuführen. Im Gegensatz zu herkömmlichen Programmen können KI-Agenten autonom funktionieren, komplexe Workflows verarbeiten und Prozesse automatisieren, ohne dass eine kontinuierliche menschliche Kontrolle erforderlich ist.
KI-Agents können mit vielen verschiedenen Tools und Plattformen entwickelt werden, einschließlich des Microsoft Agent Framework. Das Microsoft Agent Framework ist ein Open-Source-SDK, mit dem Entwickler die neuesten KI-Modelle problemlos in ihre Anwendungen integrieren können. Dieses Framework bietet eine umfassende Grundlage für die Erstellung funktionaler Agents, die die Verarbeitung natürlicher Sprachen verwenden können, um Aufgaben auszuführen und mit anderen Agents zusammenzuarbeiten.
Kernkomponenten von Microsoft Agent Framework
Das Microsoft Agent Framework bietet verschiedene Komponenten, die einzeln oder kombiniert werden können.
Agents – bietet eine konsistente Schnittstelle und ermöglicht verschiedene Features wie die Multi-Agent-Orchestrierung. Standardmäßig unterstützen Agenten Funktionsaufrufe, mehrstufige Gespräche mit Gesprächshistorie, von Diensten bereitgestellte Werkzeuge, strukturierte Ausgaben und Streaming-Antworten.
Chatanbieter – Stellen Sie Abstraktionen zum Herstellen einer Verbindung mit KI-Diensten von verschiedenen Anbietern unter einer gemeinsamen Schnittstelle bereit. Zu den unterstützten Anbietern gehören Azure OpenAI, OpenAI, Anthropic, Copilot und mehr durch die
BaseAgentAbstraktion.Funktionstools – Container für benutzerdefinierte Funktionen, die Agentfunktionen erweitern. Agents können Funktionen automatisch aufrufen, um sie in externe APIs und Dienste zu integrieren.
Integrierte Tools – vorgefertigte Funktionen, einschließlich Codedolmetscher für Python-Ausführung, Dateisuche für Dokumentanalyse und Websuche für Internetzugriff.
Konversationsverwaltung – strukturiertes Nachrichtensystem mit Rollen (USER, ASSISTANT, SYSTEM, TOOL) und
AgentSessionfür anhaltenden Unterhaltungskontext über Interaktionen hinweg.Workflow-Orchestrierung – unterstützt sequenzielle Workflows, gleichzeitige Ausführung, Gruppenchats und Übergabemuster für die komplexe Zusammenarbeit mit mehreren Agents.
Das Microsoft Agent Framework hilft bei der Optimierung der Erstellung von Agents und ermöglicht es mehreren Agents, in Unterhaltungen zusammenzuarbeiten, während menschliche Eingaben eingeschlossen werden. Das Framework unterstützt verschiedene Arten von Agents von mehreren Anbietern, einschließlich Microsoft Foundry, Azure OpenAI, OpenAI, Microsoft Copilot Studio und Anthropic Agents.
Was ist ein Microsoft Foundry Agent?
Microsoft Foundry Agents bieten Funktionen auf Unternehmensebene mithilfe des Microsoft Foundry Agent-Diensts. Diese Agents bieten erweiterte Features für komplexe Unternehmensszenarien. Die wichtigsten Vorteile umfassen Folgendes:
Funktionen auf Unternehmensebene – Entwickelt für Azure-Umgebungen mit erweiterten KI-Features , einschließlich Codedolmetscher, Integration von Funktionstools und Unterstützung des Model Context Protocol (MCP).
Automatische Toolaufrufe – Agents können Tools automatisch aufrufen und ausführen, die nahtlos in Azure AI Search, Azure Functions und andere Azure-Dienste integriert werden.
Bedrohungs- und Unterhaltungsverwaltung – Stellt integrierte Mechanismen zum Verwalten von Zuständen beständiger Unterhaltungen über Sitzungen hinweg bereit, um reibungslose Interaktionen mit mehreren Agents sicherzustellen.
Sichere Unternehmensintegration – Ermöglicht die sichere und kompatible KI-Agent-Entwicklung mit Azure CLI-Authentifizierung, RBAC und anpassbaren Speicheroptionen.
Wenn Sie Microsoft Foundry Agents verwenden, erhalten Sie die volle Leistungsfähigkeit von Enterprise Azure-Funktionen in Kombination mit den Features von Microsoft Agent Framework. Diese Features können Ihnen helfen, robuste KI-gesteuerte Workflows zu erstellen, die effizient in Geschäftsanwendungen skaliert werden können.
Kernkonzepte des Agentframeworks
BaseAgent – die Grundlage für alle Agents mit konsistenten Methoden, die eine einheitliche Schnittstelle für alle Agenttypen bereitstellen.
Agentsitzung – Verwalten des Kontexts für beständige Unterhaltungen und Speichern des Unterhaltungsverlaufs über Sitzungen mithilfe der
AgentSessionKlasse.Chatnachrichten – organisierte Struktur für die Agentkommunikation mit rollenbasiertem Messaging (USER, ASSISTANT, SYSTEM, TOOL), die eine reibungslose Kommunikation und Integration ermöglicht.
Workflow-Orchestrierung – unterstützt sequenzielle Workflows, das Ausführen mehrerer Agents parallel, Gruppenunterhaltungen zwischen Agents und die Übertragung der Kontrolle zwischen spezialisierten Agents.
Multi-modal-Unterstützung – ermöglicht Agents das Arbeiten mit Text, Bildern und strukturierten Ausgaben, einschließlich Vision-Funktionen und typsicherer Reaktionsgenerierung.
Funktionentools – ermöglichen Ihnen das Hinzufügen von benutzerdefinierten Funktionen zu Agents, indem Sie benutzerdefinierte Funktionen mit automatischer Schemagenerierung aus Python-Funktionen einschließen.
Authentifizierungsmethoden – unterstützt mehrere Authentifizierungsmethoden , einschließlich Azure CLI-Anmeldeinformationen, API-Schlüssel, MSAL für die Microsoft-Geschäftsauthentifizierung und rollenbasierte Zugriffssteuerung.
Dieses Framework unterstützt autonome KI-Verhaltensweisen mit mehreren Agenten und bietet gleichzeitig eine flexible Architektur, mit der Sie Agents, Tools und Workflows nach Bedarf kombinieren und abgleichen können. Das Design ermöglicht es Ihnen, zwischen OpenAI, Azure OpenAI, Anthropic und anderen Anbietern zu wechseln, ohne Ihren Code zu ändern, wodurch es einfach ist, KI-Systeme zu erstellen – von einfachen Chatbots bis hin zu komplexen Geschäftslösungen.