Nota
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare ad accedere o a cambiare directory.
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare a cambiare directory.
Gli agenti diventano più potenti quando li equipaggi con strumenti specializzati che estendono le loro capacità fondamentali. Copilot Studio offre tre categorie principali di strumenti per agenti:
- Prompt dell'IA per generare risposte intelligenti
- Model Context Protocol (MCP) per integrazioni standardizzate
- Strumento di utilizzo del computer per l'automazione dei processi desktop
Questo articolo esplora come funziona ogni tipo di strumento, quando usarli e come possono aiutarti a costruire agenti più capaci ed efficienti. Impari anche le differenze tra macchine ospitate e porta-porta-proprie per scenari di utilizzo computerizzato, oltre a indicazioni su come scegliere tra l'approccio tradizionale di Automazione dei Processi Robotici (RPA) e Computer Using Agents (CUA).
Genera una risposta usando prompt AI
I prompt di IA utilizzano un insieme di istruzioni per generare una risposta da un modello di IA. Puoi includere variabili per inserire più testo o documenti in queste istruzioni. L'output è tipicamente fornito in formato testo semplice o JSON. Puoi selezionare qualsiasi modello AI integrato in Copilot Studio o distribuito tramite Microsoft Foundry per generare la risposta.
Puoi invocare prompt come strumento per agenti o all'interno di un argomento. Tutti i prompt vengono salvati in una libreria di prompt e supportano la gestione del ciclo di vita delle applicazioni, il controllo degli accessi basato sui ruoli e la condivisione.
Scopri di più sull'uso dei prompt per far svolgere al tuo agente compiti specifici.
Determina quando usare i prompt AI rispetto all'orchestratore
Ogni agente integrato in Copilot Studio utilizza l'orchestratore per determinare come rispondere selezionando strumenti, argomenti e conoscenze basandosi sulle istruzioni di sistema, input dell'utente e informazioni contestuali. L'orchestratore è il motore dietro l'orchestrazione generativa, che pianifica le azioni e compone le risposte utilizzando gli strumenti e le descrizioni dell'agente.
Sebbene le risposte guidate dall'orchestratore possano sembrare simili a prompt dell'IA, le due capacità servono a scopi diversi. I prompt di IA sono azioni autonome basate su prompt che danno ai creatori un controllo più profondo sulla configurazione del modello.
I prompt di IA supportano una gamma più ampia di modelli, inclusi quelli disponibili tramite Microsoft Foundry. Supportano anche funzionalità come la messa a terra Dataverse, l'input dei file e l'interprete del codice.
L'orchestratore utilizza un prompt di sistema fisso e descrizioni degli strumenti per scegliere i blocchi di costruzione giusti per una determinata richiesta. I creatori non possono modificare il prompt di sistema dell'orchestratore, ma possono influenzare il suo comportamento tramite istruzioni dell'agente.
I prompt AI danno il pieno controllo su formattazione, vincoli e logica, rendendoli la scelta giusta per scenari che richiedono un output finemente calibrato o altamente strutturato. Ad esempio, se hai bisogno di un controllo stilistico oltre la semplice formattazione ("scrivi una poesia in rima in struttura ABAB usando queste esatte parole"), un prompt è la scelta migliore.
L'orchestratore funziona bene per compiti semplici come estrarre un singolo nome dal testo. Per estrazioni complesse, usa prompt di IA. Ad esempio, estrarre più entità da un rapporto lungo e collegarle a relazioni specifiche per un dominio (ad esempio estrarre più nomi da un rapporto assicurativo e identificare il proprietario del servizio di riparazione associato a una sola parte coinvolta nell'incidente).
La scelta tra gli spunti orchestrator e quelli dell'IA dipende dal livello di personalizzazione richiesto. Se hai bisogno di un controllo preciso sul comportamento o sull'output del modello, scegli prompt per l'IA. Per scenari in cui ragionamento generale, selezione degli strumenti e formattazione leggera sono sufficienti, l'orchestratore è la scelta appropriata.
Integra gli strumenti per agenti utilizzando MCP
Il Model Context Protocol (MCP) è un'interfaccia universale che i modelli di IA utilizzano per interagire con strumenti esterni, fonti di dati e ambienti utente in modo coerente e scalabile.
In confronto, i connettori Power Platform richiedono di descrivere ogni azione e i suoi input, e di aggiornare queste descrizioni man mano che diventano disponibili nuove definizioni. La codifica personalizzata e l'integrazione per ogni strumento è più complessa e meno scalabile.
Usa i server MCP forniti da Copilot Studio per i servizi Microsoft come Outlook, Dataverse e GitHub, oppure servizi di terze parti come Salesforce e JIRA. Costruire server MCP personalizzati per i servizi dove non ce ne sono.
I benefici dell'MCP includono:
- Contesto standardizzato per i modelli di IA
- Integrazione senza soluzione di continuità con Copilot Studio
- Miglioramento dell'efficienza degli sviluppatori e dell'esperienza utente
- Governance, monitoraggio ed estensibilità
Considera le seguenti limitazioni prima di implementare server MCP:
- Non puoi arricchire le descrizioni degli strumenti con più contesto su quando invocare.
- I Topic non possono chiamare direttamente i server MCP.
Comprendi quando usare MCP
Puoi ottenere gli stessi risultati in Copilot Studio attraverso diversi approcci di integrazione. È importante capire quando utilizzare i server Model Context Protocol (MCP) rispetto a opzioni più semplici come connettori Power Platform o chiamate API REST dirette.
Usa MCP quando hai bisogno di un modo standardizzato e centralizzato per esporre strumenti e risorse a più agenti senza una configurazione per cliente. I server MCP pubblicano strumenti e risorse che gli agenti possono automaticamente scoprire, versionare e utilizzare in modo coerente perché il server MCP definisce le descrizioni degli strumenti e i loro input. Al contrario, aggiungere direttamente un'API richiede di descrivere manualmente il suo scopo e definirne gli input per agente.
MCP è particolarmente prezioso quando le API upstream cambiano frequentemente. Invece di aggiornare ogni agente che consuma l'API, modifichi la definizione una volta sul server MCP e tutti gli agenti usano automaticamente la versione aggiornata senza ripubblicarla. Se non esiste un server MCP, o stai prototipando rapidamente, chiamare direttamente le API è più veloce e evita il sovraccarico di configurazione necessario per introdurre l'intero ciclo di vita MCP.
L'orchestrazione generativa deve essere abilitata per l'uso di MCP. Scopri di più in Come funziona il MCP?
Automatizza i processi desktop utilizzando lo strumento di utilizzo del computer
Utilizzando lo strumento di uso del computer, un agente può gestire un computer senza la necessità di script di automazione o API. Invece di usare script o API, configuri l'agente usando un prompt. L'agente determina come raggiungere al meglio i suoi obiettivi. Durante il processo, l'agente fa uno screenshot a ogni passaggio, lo analizza per decidere l'azione successiva, esegue quell'azione e ripete questo ciclo fino al completamento del compito. Gli screenshot scattati dall'agente e i passaggi di ragionamento sono disponibili come parte della cronologia delle partite.
Scenari comuni in cui un agente può beneficiare dello strumento di utilizzo del computer includono:
- Inserimento dati: Per ogni riga nel file CSV in ingresso, crea l'ordine di vendita in SAP e scrivi l'ID dell'ordine generato nel file.
- Estrazione dati: Vai su ogni portale fornitore, cerca nello SKU elencato, estrai prezzo, stock e tempi di consegna, e inserisci i risultati con un timestamp nel database.
- Tra le app: esporta le transazioni della giornata dal client finanziario desktop, naviga su QuickBooks e registra ogni voce sull'account corretto.
Capire le macchine ospitate vs. portare la tua macchina
Gli Agent possono chiamare lo strumento di uso del computer su una macchina ospitata da Microsoft o su una macchina bring-your-own (BYO). Le macchine ospitate sono disponibili per un uso immediato senza configurazione o fatturazione IT. Appartengono a un pool condiviso di PC cloud Windows 365 pre-provisionati che non sono collegati a Entra-join al tenant del cliente. Le macchine BYO devono essere provisionate in anticipo all'interno della rete virtuale del cliente. Devi registrare e gestire le macchine BYO in Power Automate.
Usa macchine BYO per scenari di produzione. Supportano Microsoft Entra ID, sono iscritti a Intune e supportano sia casi d'uso di automazione web che desktop. Usa le macchine ospitate solo per prototipare a causa delle loro capacità limitate. È disponibile un solo PC Cloud per utente alla volta, e l'utilizzo può essere limitato in base alla richiesta.
Per altre informazioni, vedere Configurare la posizione in cui viene eseguito l'uso del computer.
Automazione dei processi robotici (RPA) vs. agenti che utilizzano computer (CUA)
L'Automazione dei Processi Robotici (RPA) è l'automazione di un computer che utilizza uno script. Puoi applicarlo a molti degli stessi scenari del CUA. Tuttavia, è importante comprendere le differenze tra RPA e CUA.
| Aspetto | RPA | CUA |
|---|---|---|
| Tipo di automazione | Basato su regole | Guidato da LLM |
| Metodo di interazione | Albero UI | Vision |
| Creazione dei contenuti | Copione, complesso | Istruzioni in linguaggio naturale |
| Processo decisionale | Regole predefinite | Decisioni autonome basate sulla visuale |
| Flessibilità | Flessibilità limitata | Alta flessibilità |
| Gestione degli errori | Gestione degli errori statici | Auto-correzione basata sul feedback visivo |
Usa RPA quando:
- Sono consentite solo le funzionalità Generally Available (GA).
- L'interfaccia utente è stabile. Gli schermi, i campi e i selettori raramente cambiano.
- Le regole sono chiare. Puoi catturare le decisioni nelle regole.
- La velocità conta. Alto volume. Ogni secondo conta.
- Un team RPA ne è di proprietà. Il team possiede già conoscenza dello sviluppo e della gestione RPA.
Usa il CUA quando:
- Le interfacce utente cambiano o variano ampiamente. Lavori con più app e frequenti redesign.
- Ti serve in fretta. L'arretrato del team RPA è pieno.
- L'interfaccia utente conta. Il compito dipende da ciò che è visibile sullo schermo, come grafici, colori e layout dinamici.
- Le decisioni sono confuse. L'agente deve ragionare, scegliere il passo successivo o correggersi da solo.