Componenti dell'agente di intelligenza artificiale
Gli agenti di intelligenza artificiale sono creati da un set di componenti fondamentali che interagiscono per abilitare il comportamento intelligente.
Architettura dell'agente
Mentre tutti gli agenti condividono in genere i componenti seguenti, il modo in cui vengono implementati ed evidenziati dipende dallo scopo e dalla complessità dell'agente.
- Modello di base (LLM): il modello LLM (Large Language Model) fornisce le funzionalità generative e di ragionamento. Consente la comprensione del linguaggio naturale, la generazione e la consapevolezza contestuale.
- Orchestrator: l'agente di orchestrazione coordina il comportamento dell'agente, decidendo quando recuperare le conoscenze, richiamare le competenze o eseguire l'escalation a un utente. Gestisce flussi di lavoro, memoria e logica decisionale.
- Conoscenza: si riferisce alle informazioni usate da un agente per comprenderne l'ambiente e prendere decisioni. Sono incluse le istruzioni definite per l'agente e i dati di messa a terra a cui ha accesso, inclusi dati strutturati, contenuto non strutturato, documenti, database e input in tempo reale. Gli agenti usano queste conoscenze per fornire risposte e azioni rilevanti dal punto di vista del contesto.
- Competenze e strumenti: queste sono le azioni, le funzionalità e i flussi di lavoro che l'agente può usare per eseguire azioni quali l'invio di messaggi, l'esecuzione di query sui database o l'attivazione di flussi di lavoro automatizzati. Questi possono includere l'invio di messaggi di posta elettronica, il recupero dei dati, l'aggiornamento dei record o l'attivazione di un processo automatizzato. Le competenze sono spesso associate ad API, servizi o strumenti di automazione che l'agente può chiamare per completare le attività.
- Autonomia: questa è la logica che guida il modo in cui un agente interpreta le informazioni e sceglie le azioni. Include framework decisionali, logica basata su regole, trigger per funzionalità autonome e modelli di Machine Learning che consentono agli agenti di adattarsi e migliorare nel tempo.
Reflection:
Si pensi a un processo o a un'attività che si vuole automatizzare. Quali componenti personalizzati (conoscenze, competenze, ragionamento) sarebbero più importanti per consentire a un agente di gestire correttamente tale processo?
LlMs e agenti di intelligenza artificiale: qual è la differenza?
I modelli di linguaggio di grandi dimensioni sono il motore principale alla base dell'intelligenza artificiale generativa. Consentono agli agenti di comprendere e generare un linguaggio simile a un uomo, riepilogare il contenuto, tradurre testo e altro ancora.
Tuttavia, i soli LLM non sono agenti.
Gli agenti di intelligenza artificiale estendono la potenza delle macchine virtuali integrando componenti aggiuntivi:
- Memoria per mantenere il contesto tra le interazioni.
- Competenze per intraprendere azioni reali.
- Ragionamento e orchestrazione per gestire flussi di lavoro complessi.
- Interfacce per interagire con utenti e sistemi.
In breve: gli LLM generano intelligenza. Gli agenti applicano tale intelligence per raggiungere gli obiettivi.
Funzionamento degli agenti di intelligenza artificiale
Ecco come funziona un tipico agente di intelligenza artificiale:
- Input: un utente pone una domanda o avvia un'attività.
- Informazioni: l'LLM interpreta l'input, determina la finalità ed estrae informazioni rilevanti.
- Pianificazione: l'agente di orchestrazione, spesso con l'aiuto dell'LLM, decide quali misure intraprendere, ad esempio recuperare le conoscenze, chiamare una competenza o richiedere chiarimenti.
- Azione: l'agente esegue le azioni necessarie usando le proprie competenze o strumenti, guidati dal piano.
- Generazione di risposta: l'LLM genera una risposta in linguaggio naturale in base ai risultati delle azioni e al contesto corrente.
- Comunicazione: l'agente fornisce la risposta all'utente tramite l'interfaccia scelta.
- Apprendimento: l'agente archivia il contesto o il feedback pertinenti per migliorare le interazioni future.
Esempio:
Un dipendente chiede a un agente: "Qual è la politica di viaggio della nostra azienda e puoi prenotare un volo per Seattle per la prossima settimana?"
- L'agente recupera i criteri di viaggio aziendali più recenti dalla documentazione interna o da un knowledge base, usando la comprensione delle linee guida dell'organizzazione e dei ruoli dei dipendenti.
- Chiama quindi un'API di prenotazione dei voli esterni per cercare i voli disponibili per Seattle conformi alla politica di viaggio della società (ad esempio, compagnie aeree preferite, limiti di budget, requisiti di approvazione).
- L'agente risponde al dipendente con un riepilogo dei criteri di viaggio pertinenti, le opzioni di volo proposte e la conferma che la richiesta di prenotazione è stata avviata o completata in linguaggio naturale.
Agenti autonomi
Gli agenti autonomi operano con maggiore indipendenza, spesso perseguono obiettivi su più passaggi o sessioni con un intervento umano minimo. Un elemento chiave degli agenti autonomi è la capacità di rispondere agli eventi di trigger o alle modifiche nei dati che richiedono all'agente di agire senza input diretto dell'utente. I trigger possono includere orari pianificati, aggiornamenti dei dati, eventi di sistema esterni o modifiche nel contesto utente.
Il flusso di lavoro è in genere simile al seguente:
- Impostazione obiettivo: l'agente riceve un obiettivo di alto livello (da un utente o da un sistema).
- Monitoraggio dei trigger: l'agente monitora continuamente i trigger pertinenti, ad esempio scadenze, modifiche dei dati o eventi esterni che potrebbero richiedere un'azione.
- Pianificazione automatica: dopo aver rilevato un trigger o ricevuto un obiettivo, l'agente suddivide in modo autonomo l'obiettivo in sottoattività e crea un piano, spesso perfezionandolo in modo iterativo.
- Azione iterativa: l'agente esegue azioni, monitora i risultati e adatta il piano in base alle esigenze potenzialmente in ciclo attraverso la pianificazione e l'azione più volte. Queste azioni possono comportare l'attivazione di flussi di lavoro, combinando la potenza del comportamento autonomo con flussi di lavoro deterministici automatizzati.
- Autovalutazione: l'agente valuta lo stato di avanzamento verso l'obiettivo, decide se continuare, modificare il proprio approccio o dichiarare il completamento.
- Creazione di report/comunicazioni: l'agente riepiloga i risultati o richiede l'input solo quando necessario.
- Apprendimento continuo: l'agente aggiorna la memoria e le strategie in base ai risultati per migliorare l'autonomia futura.
Gli agenti autonomi enfatizzano la pianificazione auto-diretta, l'esecuzione basata su trigger e la minima dipendenza dall'input utente passo-passo, consentendo loro di gestire attività più complesse e multipassaggio.
Esempio:
Un'organizzazione finanziaria usa un agente di correzione fiscale compilato con flussi di agenti Copilot Studio.
- L'agente monitora continuamente i dati finanziari per individuare anomalie che potrebbero indicare la necessità di un controllo.
- Quando viene rilevata un'anomalia, attiva in modo autonomo un flusso di lavoro di controllo strutturato, raccogliendo i documenti necessari e riepilogando i risultati chiave.
- L'agente instrada quindi i risultati del controllo ai revisori umani appropriati per l'approvazione, garantendo la conformità e la trasparenza.
- Durante tutto il processo, l'agente adatta le proprie azioni in base a nuovi dati o feedback, combinando il processo decisionale autonomo con flussi di lavoro deterministici per mantenere sia la flessibilità che la conformità alle normative.
Questo ciclo basato su trigger consente agli agenti di operare in ambienti dinamici, adattarsi alle esigenze degli utenti e offrire risultati sempre più personalizzati ed efficaci.
Creazione di agenti di intelligenza artificiale
La creazione di agenti di intelligenza artificiale può richiedere una combinazione di tecnologie di base, infrastruttura e strumenti di sviluppo.
- Modelli di base (LLM): per la comprensione, il ragionamento e la generazione del linguaggio naturale.
- Livello di orchestrazione: per gestire la pianificazione, il processo decisionale e il coordinamento delle azioni.
- Competenze e strumenti: libreria di API, plug-in e servizi che l'agente può richiamare per completare le attività.
- Archivio di memoria e contesto: per conservare la memoria a breve e a lungo termine, abilitando la personalizzazione e la continuità.
- Infrastruttura dati: accesso sicuro e scalabile a origini dati strutturate e non strutturate.
- Sicurezza e governance: gestione delle identità, controllo degli accessi e monitoraggio della conformità.
- Ambiente di distribuzione: infrastruttura nativa del cloud (ad esempio, servizio Azure Kubernetes, Funzioni di Azure) per ospitare e ridimensionare l'agente.
Tuttavia, il livello di sviluppo necessario per questi livelli dello stack di intelligenza artificiale può variare in modo significativo a seconda dello scopo e della complessità dell'agente. Per gli scenari degli agenti basati su attività e recupero, potrebbe essere sufficiente aggiungere conoscenze, competenze e istruzioni sfruttando al tempo stesso l'infrastruttura esistente per il resto dello stack, ad esempio la creazione di un agente che estende Microsoft 365 Copilot. Per scenari più avanzati e complessi, è possibile personalizzare completamente la soluzione, inclusi modelli personalizzati, orchestrazione, logica, azioni, sicurezza e governance.
Soluzioni agente di intelligenza artificiale Microsoft
Microsoft offre una gamma di strumenti e soluzioni per migliorare il percorso di trasformazione dell'intelligenza artificiale, sia che si voglia creare una soluzione con uno stack di intelligenza artificiale completamente personalizzato, sia che si sfruttino i componenti esistenti insieme ai dati aziendali, alle API e alla logica di business.
- Adottare: Microsoft 365 Copilot, Copilot Chat e una gamma di agenti di prima parte offrono potenti funzionalità per supportare la produttività basata sull'intelligenza artificiale, fornita con controlli predefiniti di sicurezza e governance.
- Estendi: Microsoft 365 Copilot possono essere estesi con agenti che sfruttano il modello, l'agente di orchestrazione e l'interfaccia utente di Copilot, ma sono personalizzati per la logica di business, i dati e i sistemi personalizzati per l'automazione dei processi aziendali.
- Compilazione: è possibile usare una gamma di strumenti e servizi Microsoft, tra cui Copilot Studio, Microsoft 365 Agents Toolkit, Microsoft Foundry e altro ancora, per creare agenti personalizzati e applicazioni di intelligenza artificiale generativa commerciale per scenari più avanzati o complessi.
Microsoft offre le soluzioni migliori per gli agenti di intelligenza artificiale che possono essere usati in questo spettro, tra cui:
- Microsoft 365 Copilot e la versione lite di Copilot Studio: gli utenti aziendali possono sviluppare agenti di intelligenza artificiale usando il linguaggio naturale in un'interfaccia senza codice.
- Copilot Studio (completo): i creatori possono usare un'interfaccia a basso codice per creare agenti di intelligenza artificiale personalizzati ed estendere Microsoft 365 Copilot.
- Visual Studio/GitHub/Microsoft Foundry: gli sviluppatori possono usare questi strumenti pro-code insieme a SDK, framework e servizi come Microsoft Agent Framework, Foundry Agent Service, SDK per agenti Microsoft 365 e Microsoft 365 Agents Toolkit per progettare, compilare, personalizzare, pubblicare e gestire soluzioni di agenti di intelligenza artificiale di livello aziendale.