Composants de l’agent IA

5 minutes

Les agents IA sont créés à partir d’un ensemble de composants fondamentaux qui fonctionnent ensemble pour permettre un comportement intelligent.

Architecture de l’agent

Bien que tous les agents partagent généralement les composants suivants, la façon dont ils sont implémentés et mis en évidence dépend de l’objectif et de la complexité de l’agent.

Modèle de base (LLM) : le modèle de langage large (LLM) fournit les fonctionnalités génératives et de raisonnement. Il permet la compréhension, la génération et la reconnaissance contextuelle du langage naturel.
Orchestrateur : l’orchestrateur coordonne le comportement de l’agent, en décidant quand récupérer des connaissances, appeler des compétences ou remonter à un humain. Il gère les flux de travail, la mémoire et la logique de décision.
Connaissances : il s’agit des informations qu’un agent utilise pour comprendre son environnement et prendre des décisions. Cela inclut les instructions définies pour l’agent et les données de base auxquelles il a accès, notamment les données structurées, le contenu non structuré, les documents, les bases de données et les entrées en temps réel. Les agents utilisent ces connaissances pour fournir des réponses et des actions contextuellement pertinentes.
Compétences et outils : il s’agit des actions, des fonctionnalités et des flux de travail que l’agent peut utiliser pour effectuer des actions telles que l’envoi de messages, l’interrogation de bases de données ou le déclenchement de workflows automatisés. Il peut s’agir de l’envoi d’e-mails, de la récupération de données, de la mise à jour des enregistrements ou du déclenchement d’un processus automatisé. Les compétences sont souvent liées à des API, des services ou des outils d’automatisation auxquels l’agent peut faire appel pour effectuer des tâches.
Autonomie : il s’agit de la logique qui guide la façon dont un agent interprète les informations et choisit les actions. Il inclut des infrastructures de prise de décision, une logique basée sur des règles, des déclencheurs pour les fonctionnalités autonomes et, de plus en plus, des modèles Machine Learning qui permettent aux agents de s’adapter et de s’améliorer au fil du temps.

Réflexion :
Pensez à un processus ou une tâche que vous souhaitez automatiser. Quels composants personnalisés (connaissances, compétences, raisonnement) seraient les plus importants pour permettre à un agent de gérer correctement ce processus ?

LLMs et agents IA : Quelle est la différence ?

Les modèles de langage volumineux (LLM) sont le moteur principal derrière l’IA générative. Ils permettent aux agents de comprendre et de générer un langage de type humain, de résumer le contenu, de traduire du texte, etc.

Toutefois, les llms ne sont pas des agents.

Les agents IA étendent la puissance des llms en intégrant des composants supplémentaires :

Mémoire pour conserver le contexte entre les interactions.
Compétences pour prendre des mesures concrètes.
Raisonnement et orchestration pour gérer des flux de travail complexes.
Interfaces permettant d’interagir avec les utilisateurs et les systèmes.

En bref : les llms génèrent de l’intelligence. Les agents appliquent cette intelligence pour atteindre les objectifs.

Fonctionnement des agents IA

Voici comment fonctionne un agent IA classique :

Entrée : un utilisateur pose une question ou lance une tâche.
Compréhension : le LLM interprète l’entrée, détermine l’intention et extrait les informations pertinentes.
Planification : l’orchestrateur, souvent avec l’aide du LLM, décide des étapes à suivre, telles que la récupération des connaissances, l’appel d’une compétence ou la demande de clarification.
Action : l’agent effectue les actions requises à l’aide de ses compétences ou outils, guidés par le plan.
Génération de réponse : le LLM génère une réponse en langage naturel en fonction des résultats des actions et du contexte actuel.
Communication : l’agent fournit la réponse à l’utilisateur via l’interface choisie.
Apprentissage : L’agent stocke le contexte ou les commentaires pertinents pour améliorer les interactions futures.

Exemple :

Un employé demande à un agent : « Quelle est la politique de voyage de notre entreprise et pouvez-vous réserver un vol pour Seattle pour la semaine prochaine ? »

L’agent récupère la dernière stratégie de voyage de l’entreprise à partir de la documentation interne ou d’un base de connaissances, en utilisant sa compréhension des directives organisationnelles et des rôles des employés.
Il appelle ensuite une API de réservation de vol externe pour rechercher les vols disponibles à destination de Seattle qui sont conformes à la politique de voyage de l’entreprise (par exemple, les compagnies aériennes préférées, les limites budgétaires, les exigences d’approbation).
L’agent répond à l’employé avec un résumé de la politique de voyage pertinente, les options de vol proposées et la confirmation que la demande de réservation a été initiée ou terminée en langage naturel.

Agents autonomes

Les agents autonomes fonctionnent avec une plus grande indépendance, poursuivant souvent des objectifs sur plusieurs étapes ou sessions avec une intervention humaine minimale. Un élément clé des agents autonomes est leur capacité à répondre aux événements déclencheurs ou aux modifications de données qui invitent l’agent à agir sans intervention directe de l’utilisateur. Les déclencheurs peuvent inclure des heures planifiées, des mises à jour de données, des événements système externes ou des modifications dans le contexte utilisateur.

Leur flux de travail ressemble généralement à ceci :

Paramètre d’objectif : l’agent reçoit un objectif de haut niveau (d’un utilisateur ou d’un système).
Surveillance des déclencheurs : l’agent surveille en permanence les déclencheurs pertinents tels que les échéances, les modifications de données ou les événements externes qui peuvent nécessiter une action.
Auto-planification : lors de la détection d’un déclencheur ou de la réception d’un objectif, l’agent décompose de manière autonome l’objectif en sous-tâches et crée un plan, souvent en l’affinant de manière itérative.
Action itérative : l’agent exécute des actions, surveille les résultats et adapte son plan en fonction des besoins, en effectuant une boucle sur la planification et l’action plusieurs fois. Ces actions peuvent impliquer le déclenchement de flux de travail, en combinant la puissance du comportement autonome avec des workflows déterministes automatisés.
Auto-évaluation : l’agent évalue la progression vers l’objectif, en décidant s’il faut continuer, ajuster son approche ou déclarer l’achèvement.
Rapports/communication : l’agent résume les résultats ou demande une entrée uniquement si nécessaire.
Apprentissage continu : l’agent met à jour sa mémoire et ses stratégies en fonction des résultats pour améliorer l’autonomie future.

Les agents autonomes mettent l’accent sur la planification auto-dirigée, l’exécution basée sur un déclencheur et une dépendance minimale à l’entrée utilisateur pas à pas, ce qui leur permet de gérer des tâches multiétapes plus complexes.

Exemple :

Un organization financier utilise un agent de correction fiscale créé avec Copilot Studio flux d’agents.

L’agent surveille en permanence les données financières à la recherche d’anomalies qui peuvent indiquer la nécessité d’un audit.
Lorsqu’une anomalie est détectée, elle déclenche de manière autonome un workflow d’audit structuré, en collectant les documents nécessaires et en résumant les résultats clés.
L’agent achemine ensuite les résultats de l’audit vers les réviseurs humains appropriés pour approbation, ce qui garantit la conformité et la transparence.
Tout au long du processus, l’agent adapte ses actions en fonction de nouvelles données ou de nouveaux commentaires, combinant une prise de décision autonome avec des flux de travail déterministes pour maintenir la flexibilité et la conformité réglementaire.

Ce cycle piloté par un déclencheur permet aux agents de fonctionner dans des environnements dynamiques, de s’adapter aux besoins des utilisateurs et d’obtenir des résultats de plus en plus personnalisés et efficaces.

Création d’agents IA

La création d’agents IA peut nécessiter une combinaison de technologies de base, d’infrastructure et d’outils de développement.

Modèles de base (LLMs) : pour la compréhension, le raisonnement et la génération du langage naturel.
Couche d’orchestration : pour gérer la planification, la prise de décision et la coordination des actions.
Compétences et outils : bibliothèque d’API, de plug-ins et de services que l’agent peut appeler pour effectuer des tâches.
Mémoire et magasin de contexte : pour conserver la mémoire à court et à long terme, en activant la personnalisation et la continuité.
Infrastructure de données : accès sécurisé et évolutif aux sources de données structurées et non structurées.
Sécurité et gouvernance : gestion des identités, contrôle d’accès et surveillance de la conformité.
Environnement de déploiement : infrastructure native cloud (par exemple, Azure Kubernetes Service, Azure Functions) pour héberger et mettre à l’échelle l’agent.

Toutefois, le niveau de développement requis sur ces couches de la pile IA peut varier considérablement en fonction de l’objectif et de la complexité de l’agent. Pour les scénarios de récupération et d’agent basé sur les tâches, vous devrez peut-être simplement ajouter des connaissances, des compétences et des instructions tout en tirant parti de l’infrastructure existante pour le reste de la pile (par exemple, la création d’un agent qui étend Microsoft 365 Copilot). Pour les scénarios plus avancés et complexes, vous pouvez personnaliser entièrement votre solution, notamment les modèles personnalisés, l’orchestration, la logique, les actions, la sécurité et la gouvernance.

Solutions d’agent Microsoft AI

Microsoft propose une gamme d’outils et de solutions pour favoriser votre parcours de transformation de l’IA, que vous souhaitiez créer une solution avec une pile d’IA entièrement personnalisée ou tirer parti de composants existants avec vos données d’entreprise, vos API et votre logique métier.

Diagramme décrivant les solutions d’IA Microsoft pour permettre aux organisations d’améliorer leur productivité, de transformer les processus métier et d’innover avec des applications IA commerciales.

Adoptez : Microsoft 365 Copilot, Copilot Chat et une gamme d’agents internes offrent de puissantes fonctionnalités pour prendre en charge la productivité basée sur l’IA dès le départ, grâce à des contrôles de sécurité et de gouvernance intégrés.
Étendre : Microsoft 365 Copilot peut être étendu avec des agents qui tirent parti du modèle, de l’orchestrateur et de l’interface utilisateur de Copilot, mais qui sont adaptés à la logique métier, aux données et aux systèmes personnalisés pour l’automatisation des processus métier.
Build : Une gamme d’outils et de services Microsoft, notamment Copilot Studio, Microsoft 365 Agents Toolkit, Microsoft Foundry, etc., peut être utilisé pour créer des agents personnalisés et des applications d’IA générative commerciale pour des scénarios plus avancés ou complexes.

Microsoft fournit les meilleures solutions pour les agents IA qui peuvent être utilisés dans ce spectre, notamment :

Microsoft 365 Copilot et la version allégée de Copilot Studio : les utilisateurs professionnels peuvent développer des agents IA à l’aide du langage naturel dans une interface sans code.
Copilot Studio (complet) : les créateurs peuvent utiliser une interface à faible code pour créer des agents IA personnalisés et étendre Microsoft 365 Copilot.
Visual Studio/GitHub/Microsoft Foundry : les développeurs peuvent utiliser ces outils pro-code, ainsi que des sdk, des infrastructures et des services tels que Microsoft Agent Framework, Foundry Agent Service, Microsoft 365 Agents SDK et Microsoft 365 Agents Toolkit pour concevoir, créer, personnaliser, publier et gérer des solutions d’agent IA de niveau entreprise.

Commentaires

Cette page a-t-elle été utile ?