Utöka agentfunktioner med verktyg

Slutförd

En av de mest kraftfulla funktionerna i AI-agenter är deras förmåga att använda verktyg som utökar deras funktioner utöver textgenerering. Verktyg gör det möjligt för agenter att utföra åtgärder, komma åt data och integrera med externa system. Microsoft Foundry tillhandahåller inbyggda verktyg och stöder anpassade integreringar och omvandlar agenter från enkla chattgränssnitt till avancerade automatiseringssystem.

Förstå agentverktygen

Verktyg är programmatiska funktioner som agenter kan anropa för att slutföra uppgifter. När en agent fastställer att ett verktyg behövs för att svara på en användarbegäran anropar den automatiskt rätt verktyg, bearbetar resultaten och införlivar dem i sitt svar. Med den här funktionen kan agenter arbeta med realtidsdata, köra kod, söka efter kunskapsbaser och interagera med externa tjänster.

Livscykeln för verktygsanrop sker automatiskt:

  1. Användaren skickar ett meddelande till agenten
  2. Agenten analyserar begäran och avgör vilka verktyg (om några) som behövs
  3. Agenten anropar lämpliga verktyg med relevanta parametrar
  4. Verktyg kör och returnerar resultat
  5. Agenten införlivar resultat i ett svar på naturligt språk
  6. Svaret returneras till användaren

Den här sömlösa integreringen innebär att du kan lägga till kraftfulla funktioner till agenter utan att skriva komplex orkestreringskod.

Översikt över inbyggda verktyg

Microsoft Foundry tillhandahåller en verktygskatalog som organiserar tillgängliga verktyg i tre kategorier: Konfigurerade (färdiga att använda inbyggda verktyg), Katalog (ytterligare verktyg som du kan lägga till från ett register, inklusive MCP-servrar) och Anpassade (dina egna verktyg via OpenAPI-specifikationer eller anpassade implementeringar). Du kan komma åt verktygskatalogen via Build > Tools i portalen eller via VS Code-tillägget.

Följande är några av de vanligaste verktygen.

Kodtolkare

Kodtolkare gör det möjligt för agenter att skriva och köra Python kod i en säker, sandbox-miljö. Använd den för matematiska beräkningar, dataanalys, diagramgenerering, filbearbetning och komplex problemlösning. Om en användare till exempel ber en agent att "beräkna den sammansatta räntan på en investering på 10 000 USD till 5% årsränta över 10 år", skriver agenten och kör Python kod för att beräkna det exakta resultatet.

Filsökning ger hämtningsförhöjd generering (RAG) genom att tillåta agenter att söka igenom dokument som du har laddat upp. Verktyget indexerar dina dokument i ett vektorlager och hämtar relevant information vid behov, med grundning i agentens svar i din specifika kunskapsbas.

Filsökning stöder PDF, Word (.docx), oformaterad text (.txt), Markdown (.md) och andra format. När du lägger till Filsökning i en agent skapar eller väljer du ett vektorlager, laddar upp dokument och systemet indexerar dem automatiskt för semantisk sökning.

Webbsökning i Bing ansluter din agent till internetinformation i realtid, vilket ger åtkomst till aktuella händelser, populära ämnen och information utöver träningsdata. Den innehåller automatisk källhänvisningsgenerering, så att agenter kan referera till sina källor.

Azure AI Search ger avancerad kunskapshämtning från dina befintliga sökindex. Till skillnad från Filsökning (som fungerar med dokument som laddas upp direkt till agenten) ansluter Azure AI Search till indexerade datakällor i företagsskala för strukturerade och ostrukturerade sökscenarier.

OpenAPI-verktyg

OpenAPI-verktyg gör det möjligt för agenter att interagera med externa API:er som definieras av OpenAPI 3.0-specifikationer och ansluta dina agenter till webbtjänster och företagssystem. Du anger specifikationen och Microsoft Foundry hanterar parametermappning och svarsparsing.

Ytterligare inbyggda verktyg

Verktygskatalogen innehåller många fler verktyg för specialiserade scenarier:

Verktyg Beskrivning
Webbläsarautomatisering Interagera med webbsidor, fylla i formulär och extrahera innehåll
Datoranvändning Interagera med skrivbordsprogram
Bildgenerering Skapa bilder baserat på textbeskrivningar
SharePoint Åtkomst SharePoint innehåll och dokumentbibliotek
Microsoft Fabric Ansluta till Infrastrukturdataagenter för dataanalys
Djup forskning Utföra djupgående forskning mellan flera källor
Agent-till-agent Delegera uppgifter till andra agenter
Anpassad kodtolkare Anpassningsbar och konfigurerbar kodkörning för specialiserade miljöer

Verktygskatalogen fortsätter att expandera. I Foundry-portalen finns de senaste tillgängliga verktygen.

Lägga till verktyg i Visual Studio Code

Microsoft Foundry-tillägget ger ett intuitivt gränssnitt för att lägga till och konfigurera verktyg. Du kan lägga till verktyg antingen via den visuella designern eller genom att redigera YAML-filen direkt.

Använda den visuella designern

Så här lägger du till verktyg via agentdesignern:

  1. Öppna din agent i agentdesignern
  2. Gå till avsnittet Verktyg i konfigurationspanelen
  3. Välj Lägg till verktyg eller + ikonen
  4. Bläddra bland de tillgängliga verktygen i verktygsbiblioteket
  5. Välj det verktyg som du vill lägga till
  6. Konfigurera verktygsspecifika inställningar om det behövs
  7. Spara ändringarna

Skärmbild av verktygets kataloggränssnitt i Tillägget Microsoft Foundry VS Code.

När du lägger till vissa verktyg uppmanas du att konfigurera relaterade tillgångar i tillägget. Om du till exempel lägger till Filsökning kan du skapa eller välja ett vektorlager för dokumentindexering.

Lägga till verktyg via YAML

Du kan också lägga till verktyg genom att redigera AGENT YAML-filen direkt. Den här metoden fungerar bra när du vet exakt vilka verktyg du behöver eller vill tillämpa ändringar från mallar.

Här är ett exempel på YAML-konfiguration med flera verktyg:

version: 1.0.0
name: research-assistant
description: Helps with research tasks using code analysis and web search
model:
  id: 'gpt-4o-deployment'
instructions: |
  You're a research assistant helping users gather and analyze information.
  Use Code Interpreter for data analysis and Bing Search for current information.
tools:
  - type: code_interpreter
  - type: bing_grounding
    bing_grounding:
      connection_id: "your-connection-id"
  - type: file_search
    file_search:
      vector_store_ids:
        - "vectorstore-123"

Verktygsmatrisen visar varje aktiverat verktyg med dess konfiguration. Vissa verktyg kräver ytterligare parametrar som anslutnings-ID eller referenser för vektorarkiv.

MCP-servrar (Model Context Protocol)

Model Context Protocol (MCP) är ett standardiserat sätt att lägga till anpassade verktyg i agenter. MCP-servrar är tillgängliga via avsnittet Katalog i verktygskatalogen och erbjuder återanvändbara verktygsgränssnitt som fungerar konsekvent i olika agentimplementeringar.

Typer av MCP-servrar

Foundry-verktygskatalogen stöder tre typer av MCP-servrar:

  • Fjärr-MCP-servrar – hanteras externt och nås via nätverket. Dessa är den vanligaste typen för produktionsscenarier.
  • Lokala MCP-servrar – Kör på din lokala dator under utvecklingen. Användbart för att testa anpassade verktyg innan du distribuerar.
  • Anpassade MCP-servrar – Dina egna MCP-serverimplementeringar som är skräddarsydda för specifika behov.

Fördelar med MCP-servrar

MCP-servrar ger flera fördelar:

Standardiserat protokoll – Konsekventa kommunikationsmönster för verktyg gör integreringen förutsägbar och tillförlitlig.

Återanvändbara komponenter – Skapa verktyg en gång och använd dem i flera agenter och projekt.

Community-drivna verktyg – Åtkomstverktyg som skapats av communityn via MCP-register och utökar funktioner utan anpassad utveckling.

Förenklad integrering – Konsekventa gränssnitt minskar integreringskomplexiteten och underhållsbelastningen.

Använda MCP-servrar i VS Code

Microsoft Foundry-tillägget stöder MCP-serverintegrering:

  1. Bläddra bland tillgängliga MCP-servrar via tilläggets verktygsregister
  2. Lägga till MCP-servrar i agentkonfigurationen
  3. Konfigurera serverspecifika inställningar och parametrar
  4. Testa MCP-serverfunktioner i den integrerade lekplatsen
  5. Distribuera agenter med MCP-serverintegreringar till produktion

MCP-servrar utökar agentens funktioner med specialiserade funktioner samtidigt som en konsekvent utvecklingsupplevelse upprätthålls.

Metodtips för konfiguration av verktyg

Effektiv verktygshantering säkerställer tillförlitlig agentprestanda:

  • Börja med inbyggda verktyg innan du skapar anpassade lösningar. Inbyggda verktyg testas, underhålls och optimeras för plattformen.
  • Matcha verktyg efter krav – Lista vad din agent behöver göra och välj verktyg i enlighet med detta. Lägg inte till verktyg utan tydliga syften eftersom varje verktyg lägger till svarstid.
  • Ge tydliga instruktioner – Berätta för din agent när och hur du använder varje verktyg (till exempel "Använd kodtolk för matematiska beräkningar") och när du inte ska använda dem.
  • Håll kunskapsbaserna aktuella – Uppdatera dokument regelbundet när du använder Filsökning. Inaktuell information leder till felaktiga svar.
  • Testa verktygets beteende noggrant med hjälp av den integrerade lekplatsen. Skicka meddelanden som ska utlösa verktygsanvändning, verifiera rätt anrop och testa felscenarier.

Agenter kan använda flera verktyg tillsammans för att hantera komplexa scenarier. En forskningsagent kan till exempel använda webbsökning i Bing för att samla in aktuell information, kodtolk för att analysera data och Filsökning för att referera till intern dokumentation – allt orkestrerat automatiskt baserat på användarens begäran.

Genom att utöka agentfunktionerna med verktyg omvandlas enkla chattgränssnitt till kraftfulla automatiseringssystem. Genom att kombinera inbyggda verktyg med anpassade integreringar och MCP-servrar kan du skapa agenter som sömlöst interagerar med dina data, system och tjänster och samtidigt upprätthålla säkerhet och tillförlitlighet i företagsklass.

Mer ingående diskussion om både verktyg och MCP-servrar finns i senare moduler.