Förstå AI-agenter för Microsoft Agent Framework
En AI-agent är ett program som använder generativ AI för att tolka data, fatta beslut och utföra uppgifter för användare eller andra program. AI-agenter förlitar sig på stora språkmodeller för att utföra sina uppgifter. Till skillnad från traditionella program kan AI-agenter fungera självständigt, hantera komplexa arbetsflöden och automatisera processer utan att kräva kontinuerlig mänsklig tillsyn.
AI-agenter kan utvecklas med många olika verktyg och plattformar, inklusive Microsoft Agent Framework. Microsoft Agent Framework är en SDK med öppen källkod som gör det möjligt för utvecklare att enkelt integrera de senaste AI-modellerna i sina program. Det här ramverket ger en omfattande grund för att skapa funktionella agenter som kan använda bearbetning av naturligt språk för att slutföra uppgifter och samarbeta med andra agenter.
Kärnkomponenter i Microsoft Agent Framework
Microsoft Agent Framework erbjuder olika komponenter som kan användas individuellt eller kombineras.
Chattklienter – tillhandahåller abstraktioner för att ansluta till AI-tjänster från olika leverantörer under ett gemensamt gränssnitt. Exempel på leverantörer som stöds är Azure OpenAI, OpenAI, Anthropic med mera genom abstraktionen
BaseChatClient.Funktionsverktyg – containrar för anpassade funktioner som utökar agentfunktioner. Agenter kan automatiskt anropa funktioner för att integrera med externa API:er och tjänster.
Inbyggda verktyg – fördefinierade funktioner som kodtolkare för Python-körning, filsökning för dokumentanalys och webbsökning för internetåtkomst.
Konversationshantering – strukturerat meddelandesystem med roller (ANVÄNDARE, ASSISTENT, SYSTEM, VERKTYG) och
AgentThreadför beständiga konversationskontexter mellan interaktioner.Arbetsflödesorkestrering – stöder sekventiella arbetsflöden, samtidig körning, gruppchatt och överlämningsmönster för komplext samarbete med flera agenter.
Microsoft Agent Framework hjälper till att effektivisera skapandet av agenter och gör det möjligt för flera agenter att arbeta tillsammans i konversationer samtidigt som mänskliga indata inkluderas. Ramverket stöder olika typer av agenter från flera leverantörer, inklusive Microsoft Foundry, Azure OpenAI, OpenAI, Microsoft Copilot Studio och antropiska agenter.
Vad är en Microsoft Foundry-agent?
Microsoft Foundry-agenter tillhandahåller funktioner på företagsnivå med hjälp av Microsoft Foundry Agent Service. Dessa agenter erbjuder avancerade funktioner för komplexa företagsscenarier. Viktiga fördelar är:
Funktioner på företagsnivå – Byggd för Azure-miljöer med avancerade AI-funktioner , inklusive kodtolkare, integrering av funktionsverktyg och stöd för Model Context Protocol (MCP).
Automatisk anrop av verktyg – Agenter kan automatiskt anropa och köra verktyg, integrera sömlöst med Azure AI Search, Azure Functions och andra Azure-tjänster.
Tråd- och konversationshantering – Innehåller inbyggda mekanismer för att hantera beständiga konversationstillstånd mellan sessioner, vilket säkerställer smidiga interaktioner med flera agenter.
Säker företagsintegrering – Möjliggör säker och kompatibel AI-agentutveckling med Azure CLI-autentisering, RBAC och anpassningsbara lagringsalternativ.
När du använder Microsoft Foundry-agenter får du den fulla kraften i Azure-funktionerna för företag i kombination med funktionerna i Microsoft Agent Framework. De här funktionerna kan hjälpa dig att skapa robusta AI-drivna arbetsflöden som kan skalas effektivt i affärsprogram.
Grundläggande begrepp för Agent Framework
BaseAgent – grunden för alla agenter med konsekventa metoder, vilket ger ett enhetligt gränssnitt för alla agenttyper.
Agenttrådar – hantera beständiga konversationskontexter och lagra konversationshistorik mellan sessioner med hjälp av
AgentThreadklassen.Chattmeddelanden – organiserad struktur för agentkommunikation med rollbaserade meddelanden (ANVÄNDARE, ASSISTENT, SYSTEM, VERKTYG) som möjliggör smidig kommunikation och integrering.
Arbetsflödesorkestrering – stöder sekventiella arbetsflöden, körning av flera agenter parallellt, gruppkonversationer mellan agenter och överföring av kontroll mellan specialiserade agenter.
Multimodal support – tillåter agenter att arbeta med text, bilder och strukturerade utdata, inklusive bildigenkänningsfunktioner och typsäker generering av svar.
Funktionsverktyg – låter dig lägga till anpassade funktioner till agenter genom att inkludera anpassade funktioner med automatisk schemagenerering från Python-funktioner.
Autentiseringsmetoder – stöder flera autentiseringsmetoder, inklusive Azure CLI-autentiseringsuppgifter, API-nycklar, MSAL för Microsoft-företagsautentisering och rollbaserad åtkomstkontroll.
Det här ramverket stöder autonoma AI-beteenden med flera agenter samtidigt som du upprätthåller en flexibel arkitektur som gör att du kan blanda och matcha agenter, verktyg och arbetsflöden efter behov. Med designen kan du växla mellan OpenAI, Azure OpenAI, Anthropic och andra leverantörer utan att ändra din kod, vilket gör det enkelt att skapa AI-system – från enkla chattrobotar till komplexa affärslösningar.