Nutzen des Copilot-Stapels, um Ihren KI-Build zu beschleunigen
Was ist ein benutzerdefinierter Agent?
Benutzerdefinierte Engine-Agents sind programmierbare Copilot-Agents, die Entwicklern die vollständige Kontrolle über Orchestrierung, KI-Modelle und Datenintegrationen geben, die entwickelt wurden, um die leistungsstarken Funktionen von Large Language Models (LLMs) für eine nahtlose Benutzerinteraktion zu nutzen. Diese erweiterten Agents stellen eine erhebliche Abkehr von herkömmlichen Bots dar und bieten eine umfangreiche Palette von Features, die die allgemeine Benutzererfahrung verbessern. Benutzerdefinierte Engine-Agents nutzen LLM-Technologie im Kern, die es ihnen ermöglicht, Benutzerabfragen einfach zu verstehen und darauf zu reagieren, wodurch dynamische und immersive Interaktionen entstehen. Benutzerdefinierte Engine-Agents bieten auch erweiterte Funktionen wie Benutzeroberflächenbearbeitung, Aufgabenausführung und Inhaltserstellung, sodass sie unverzichtbare Tools für die Optimierung von Workflows und die Steigerung der Produktivität sind. Für Entwickler bieten benutzerdefinierte Engine-Agents Flexibilität bei der Modellauswahl und -orchestrierung, sodass Sie Ihre vorhandenen Teams-Botentwicklungskompetenzen nutzen und gleichzeitig die Barrierefreiheit für alle Microsoft 365-Benutzer sicherstellen können. Diese Agents sind hochgradig anpassungsfähig für die Verwendung im Kundendienst, Support und Informationsübermittlung, mit der Möglichkeit, Ihre kontextbezogenen Daten zu nutzen, um die Benutzererfahrung zu verbessern. Sie lassen sich nahtlos in Teams integrieren und führen natürliche Unterhaltungen mit Benutzern über Chats, Kanäle und Besprechungen hinweg, sodass sie benutzer direkt im Ablauf ihrer Arbeit treffen können.
Grundlegendes zum Copilot-Stapel
Der Copilot-Stapel von Microsoft ist die End-to-End-Architektur, die Copilot-Erfahrungen zugrunde liegt, von der Cloudinfrastruktur und KI-Modellen bis hin zur Orchestrierungslogik, Erweiterbarkeitsebenen und Sicherheitssystemen. Wenn Sie einen benutzerdefinierten KI-Agent mit dem Microsoft 365 Agents SDK erstellen, nutzen Sie jede Ebene dieses Stapels – häufig durch Anpassen oder Austauschen von Komponenten – um einen Agent zu erstellen, der für Ihr Geschäftsszenario geeignet ist. Im Folgenden werden die Hauptkomponenten des Copilot-Stapels aufschlüsselt und deren Beziehung zur Entwicklung benutzerdefinierter Agents erläutert, einschließlich der Tools und Entwicklungspfade (Azure OpenAI, Teams KI-Bibliothek, Copilot Studio usw.), die Sie auf jeder Ebene verwenden können.
Pro-Code Path: Azure OpenAI and Teams AI Library
Für Entwickler, die einen Teams-orientierten Copilot erstellen, verwendet dieser Pfad Azure OpenAI Service zum Hosten des LLM und der Teams KI-Bibliothek für die Orchestrierung innerhalb einer Teams-App. Sie schreiben Code (z. B. mit dem Microsoft 365 Agents Toolkit in VS Code), um das ausgewählte Modell aufzurufen und Absichten zu behandeln. Die Teams KI-Bibliothek bietet Konversationsgerüste, einen Absichtsplaner, Arbeitsspeicher und Teams-Plattformintegration, damit Ihr Bot Benutzereingabeaufforderungen interpretieren und Aktionen ausführen kann. Dieser Ansatz bietet Flexibilität bei der Integration von Teams-Features (Nachrichtenerweiterungen, adaptive Karten usw.) und bietet Ihnen eine präzise Kontrolle über die Logik, während Sie von den Funktionen des Copilot-Stapels profitieren. Wichtige Komponenten des Copilot-Stapels Um einen benutzerdefinierten Copilot zu erstellen, ist es wichtig, jede Ebene des Copilot-Stapels und ihre Rolle zu verstehen. Der Stapel kann in drei Ebenen visualisiert werden:
- die Back-End-KI-Infrastruktur und -Modelle,
- Die KI-Orchestrierungsebene, die das Denken und die Verwendung von Tools verwaltet
- die Front-End-Benutzeroberfläche, in der der Agent mit Benutzern interagiert.
Benutzerdefinierte Agents können die Implementierungen von Microsoft für diese Ebenen verwenden oder benutzerdefinierte über das SDK einführen. Im nächsten Abschnitt finden Sie die wichtigsten Ebenen, die für benutzerdefinierte Agents relevant sind:
KI-Infrastruktur und -Basismodelle (Back-End)
Die Basis des Stapels sind die großen Sprachmodelle (Large Language Models, LLMs) und die Cloudinfrastruktur, in der sie und Ihre Daten gehostet werden. Microsoft 365 Copilot verwendet gehostete GPT-Modelle (wie GPT-4), die in der KI-Supercomputing-Infrastruktur von Azure ausgeführt werden. Dies bietet Zuverlässigkeit, Sicherheit und Compliance auf Unternehmensniveau (Ihre Daten werden während der Übertragung und im Ruhezustand verschlüsselt und nicht zum Trainieren der Microsoft-Modelle verwendet). Dies bedeutet auch, dass Inhaltsfilter- und Sicherheitssysteme auf Modellebene eingefügt werden. Azure OpenAI Service überprüft Eingabeaufforderungen und Vervollständigungen automatisch anhand eines KI-Inhaltssicherheitsmodells und blockiert oder bearbeitet Ausgaben, die unzulässige Inhalte enthalten. Für einen benutzerdefinierten Agent umfasst diese Ebene die Auswahl und Bereitstellung Ihres Modells. Die Verwendung des Azure OpenAI-Diensts ist ein gängiger Ansatz: Sie können eine Bereitstellung von GPT-4 oder GPT-3.5 (z. B. gpt-35-turbo-16k) in Azure einrichten, wodurch Sie einen privaten Endpunkt und einen API-Schlüssel zum Aufrufen dieses Modells erhalten. Mit Azure OpenAI können Sie auch das Feature "Azure OpenAI on Your Data" (im Wesentlichen Retrieval Augmented Generation, RAG) aktivieren, um einen Cognitive Search-Index oder eine Vektordatenbank Ihrer Dokumente anzufügen, damit das Modell seine Antworten in diesen Daten finden kann. Alternativ können Sie mit dem Microsoft 365 Agents SDK andere Modellhosts verwenden: Sie können z. B. bei Bedarf Azure AI Foundry Modelle oder sogar Open-Source-LLMs einbinden, sodass sie auf der Basismodellebene uneingeschränkt flexibel sind. In allen Fällen hängt die Qualität und der Umfang Ihres benutzerdefinierten Agents von dieser Ebene ab. Sie können ein Modell mit größerer Kontextlänge für lange Dokumente oder ein domänenspezifisches Modell für spezialisiertes Wissen auswählen. Die Microsoft 365 Copilot-Infrastruktur und Azure tragen hier auch wichtige Dienste wie sichere Authentifizierung (über Entra ID/AAD), Complianceprotokollierung und Skalierung mit leistungsstarker GPU-Hardware bei.
Orchestrierungs- und Argumentationsebene
Zusätzlich zum rohen Modell macht die Orchestrierungsebene von Copilot einen LLM in einen interaktiven Agent, der mehrstufige Aufgaben ausführen und Tools verwenden kann. Standardmäßig verfügt Microsoft 365 Copilot über einen Orchestrator, der den Dialog verwaltet: Er versorgt die Modellsystem-Eingabeaufforderungen mit Benutzerkontext, entscheidet, wann externe Plug-Ins aufgerufen werden sollen, und durchläuft Planungsschritte, bis eine endgültige Antwort erstellt wird. In benutzerdefinierten Agents können Sie sich auf die Orchestrierung von Microsoft verlassen oder Eigenes implementieren. Die Teams KI-Bibliothek für instance stellt eine Orchestrierungs-Engine für Bots bereit: Sie verfügt über einen integrierten Planer, der das Modell verwendet, um Benutzereingaben zu interpretieren und sie einem Aktionshandler oder einer Funktion in Ihrem Code zuzuordnen. Außerdem werden der Konversationszustand und der Kontext über Wendungen hinweg verwaltet, und das Prompt Engineering wird vereinfacht, indem Sie Systemanweisungen und Beispieldialoge für Ihren Bot definieren können. Im Wesentlichen handelt es sich um einen vorgefertigten Controller, der den LLM umschließt und komplexe Interaktionen ermöglicht. Mit dem Microsoft 365 Agents SDK (Pro-Code) haben Sie mehr Kontrolle: Sie können die Orchestrierungsschleife über die Erweiterungspunkte des SDK anschließen oder sie sogar vollständig durch eine benutzerdefinierte Orchestrierung ersetzen. Für instance können erweiterte Szenarien den semantischen Kernel oder einen maßgeschneiderten Planer verwenden, um ein Multi-Agent-System zu orchestrieren, in dem ein Agent einen anderen aufrufen kann. Die Architekturdiagramme von Microsoft zeigen, dass das "Gehirn" eines Agents in Komponenten wie Wissen, Fähigkeiten, Planung/Autonomie und den Orchestrator unterteilt werden kann, der diese miteinander verbindet. Bei der Entwicklung eines benutzerdefinierten Copiloten entscheiden Sie, wie viel von diesem Gehirn Sie selbst erstellen. Viele Entwickler beginnen mit dem bereitgestellten Planer (z. B. der KI-Bibliothek von Teams), um die Absichtsbehandlung und Funktionsaufrufe sofort zu erhalten, und erweitern sie dann nach Bedarf. Entscheidend ist, dass die Orchestrierungsebene auch der Ort ist, an dem Copilot-Systemeingabeaufforderungen und einige wenige Beispiele live sind – diese stellen sicher, dass das Modell anweisungen folgt (z. B. "Sie sind ein Assistent, der X und Y tun kann") und die Antworten richtig formatiert. Die Microsoft 365 Copilot-Plattform bietet Standardmäßige Systemeingabeaufforderungen (einschließlich Inhaltsrichtlinien), und mit dem SDK können Sie diese Anweisungen erweitern oder ändern, um das Verhalten Ihres Agents zu beeinflussen.
Die folgende Abbildung zeigt eine Abbildung des Copilot-Stapels: