Partage via


Utilisez les outils d’agents pour étendre, automatiser et améliorer vos agents

Les agents deviennent plus puissants lorsque vous les équipez d’outils spécialisés qui étendent leurs capacités principales. Copilot Studio propose trois principales catégories d’outils pour agents :

Cet article explore le fonctionnement de chaque type d’outil, le moment de leur utilisation, et comment ils peuvent vous aider à construire des agents plus compétents et efficaces. Vous apprenez également les différences entre les machines hébergées et celles à « apportez votre propre machine » pour des scénarios d’utilisation informatique, ainsi que des conseils pour choisir entre les approches traditionnelles d’automatisation robotique des processus (RPA) et d’agents informatiques (CUA).

Générez une réponse en utilisant des invites IA

Les invites IA utilisent un ensemble d’instructions pour générer une réponse à partir d’un modèle d’IA. Vous pouvez inclure des variables pour insérer plus de texte ou de documents dans ces instructions. La sortie est généralement fournie en texte brut ou au format JSON. Vous pouvez sélectionner n’importe quel modèle d’IA intégré à Copilot Studio ou déployé via Microsoft Foundry pour générer la réponse.

Vous pouvez invoquer des prompts comme un outil d’agent ou depuis un même sujet. Toutes les questions sont sauvegardées dans une bibliothèque de prompts et supportent la gestion du cycle de vie des applications, le contrôle d’accès basé sur les rôles et le partage.

Découvrez comment utiliser des consignes pour faire accomplir des tâches spécifiques à votre agent.

Déterminez quand utiliser les invites IA par rapport à l’orchestrateur

Chaque agent intégré dans Copilot Studio utilise l’orchestrateur pour déterminer comment réagir en sélectionnant des outils, des sujets et des connaissances en fonction des instructions système, des entrées utilisateur et des informations contextuelles. L’orchestrateur est le moteur derrière l’orchestration générative, qui planifie les actions et compose les réponses en utilisant les outils et descriptions de l’agent.

Bien que les réponses pilotées par l’orchestrateur puissent sembler similaires à des indications IA, les deux capacités ont des objectifs différents. Les invites IA sont des actions autonomes basées sur des prompts qui donnent aux créateurs un contrôle plus profond sur la configuration des modèles.

Les invites IA prennent en charge un éventail plus large de modèles, y compris ceux disponibles via Microsoft Foundry. Ils prennent également en charge des fonctionnalités telles que la mise à la terre Dataverse, les entrées de fichiers et l’interpréteur de code.

L’orchestrateur utilise une invite système fixe et des descriptions d’outils pour choisir les bons blocs de construction pour une requête donnée. Les créateurs ne peuvent pas modifier l’invite système de l’orchestrateur, mais ils peuvent influencer son comportement via les instructions de l’agent.

Les invites IA donnent un contrôle total sur la mise en forme, les contraintes et la logique, ce qui en fait le choix idéal pour les scénarios nécessitant une sortie finement ajustée ou très structurée. Par exemple, si vous avez besoin d’un contrôle stylistique au-delà de la simple mise en forme (« écrire un poème rimé en structure ABAB en utilisant ces mots exacts »), un prompt est le plus adapté.

L’orchestrateur fonctionne bien pour des tâches simples comme extraire un seul nom du texte. Pour une extraction complexe, utilisez des indications IA. Par exemple, extraire plusieurs entités d’un long rapport et les lier à des relations spécifiques à un domaine (comme extraire plusieurs noms d’un rapport d’assurance et identifier le propriétaire du service de réparation automobile associé à une seule partie impliquée dans l’incident).

Le choix entre les invites Orchestrator et AI dépend du niveau de personnalisation requis. Si vous avez besoin d’un contrôle précis sur le comportement ou la sortie du modèle, choisissez les invites IA. Dans les situations où le raisonnement général, la sélection des outils et la mise en forme légère sont suffisants, l’orchestrateur est le choix approprié.

Intégrez les outils d’agent en utilisant MCP

Le protocole de contexte de modèle (MCP) est une interface universelle que les modèles d’IA utilisent pour interagir de manière cohérente et évolutive avec des outils externes, des sources de données et des environnements utilisateurs.

En comparaison, les connecteurs Power Platform exigent que vous décriviez chaque action et ses entrées, et que vous mettiez à jour ces descriptions au fur et à mesure que de nouvelles définitions deviennent disponibles. Le codage personnalisé et l’intégration pour chaque outil est plus complexe et moins évolutif.

Utilisez les serveurs MCP fournis par Copilot Studio pour les services Microsoft comme Outlook, Dataverse et GitHub, ou des services tiers comme Salesforce et JIRA. Construis des serveurs MCP personnalisés pour les services là où il n’y en a pas.

Les avantages du MCP incluent :

  • Contexte standardisé pour les modèles d’IA
  • Intégration transparente avec Copilot Studio
  • Amélioration de l’efficacité des développeurs et de l’expérience utilisateur
  • Gouvernance, surveillance et extensibilité

Considérez les limitations suivantes avant de mettre en œuvre des serveurs MCP :

  • On ne peut pas enrichir les descriptions des outils avec plus de contexte sur le moment d’invoquer.
  • Les sujets ne peuvent pas appeler directement les serveurs MCP.

Comprendre quand utiliser le MCP

Vous pouvez obtenir les mêmes résultats dans Copilot Studio grâce à plusieurs approches d’intégration. Il est important de comprendre quand utiliser les serveurs Model Context Protocol (MCP) par rapport à des options plus simples comme les connecteurs Power Platform ou les appels API REST directs.

Utilisez MCP lorsque vous avez besoin d’un moyen standardisé et centralisé d’exposer outils et ressources à plusieurs agents sans configuration par client. Les serveurs MCP publient des outils et des ressources que les agents peuvent automatiquement découvrir, adapter et utiliser de manière cohérente car le serveur MCP définit les descriptions des outils et leurs entrées. En revanche, ajouter une API directement nécessite de décrire manuellement son objectif et de définir ses entrées par agent.

Le MCP est particulièrement précieux lorsque les API en amont changent fréquemment. Au lieu de mettre à jour chaque agent qui consomme l’API, vous modifiez la définition une fois sur le serveur MCP, et tous les agents utilisent automatiquement la version mise à jour sans la republier. Si aucun serveur MCP n’existe, ou si vous faites rapidement des prototypes, appeler directement les API est plus rapide et évite la surcharge de configuration nécessaire pour introduire tout le cycle de vie MCP.

L’orchestration générative doit être activée pour utiliser MCP. En savoir plus dans Comment fonctionne le MCP ?

Automatisez les processus de bureau en utilisant l’outil d’utilisation informatique

En utilisant l’outil d’utilisation de l’ordinateur, un agent peut faire fonctionner un ordinateur sans avoir besoin de scripts d’automatisation ou d’API. Au lieu d’utiliser des scripts ou des API, vous configurez l’agent en utilisant une invite. L’agent détermine la meilleure façon d’atteindre ses objectifs. Pendant le processus, l’agent prend une capture d’écran à chaque étape, l’analyse pour décider de l’action suivante, exécute cette action, puis répète ce cycle jusqu’à la fin de la tâche. Des captures d’écran prises par l’agent et des étapes de raisonnement sont disponibles dans l’historique des parties.

Parmi les scénarios courants où un agent peut bénéficier de l’outil d’utilisation informatique :

  • Saisie de données : Pour chaque ligne du fichier CSV entrant, créez la commande de vente dans SAP et réécrivez l’ID de commande généré dans le fichier.
  • Extraction des données : Rendez-vous sur chaque portail fournisseur, recherchez le SKU listé, extrayez le prix, le stock et le délai de livraison, puis insérez les résultats avec un horodatage dans la base de données.
  • À travers les applications : exportez les transactions de la journée depuis le client financier de bureau, naviguez dans QuickBooks et enregistrez chaque entrée sur le bon compte.

Comprendre les machines hébergées vs. apporter ta propre machine

Les agents peuvent appeler l’outil d’utilisation informatique sur une machine hébergée par Microsoft ou sur une machine bring-your-own (BYO). Les machines hébergées sont disponibles pour une utilisation immédiate sans configuration ou facturation informatique. Ils appartiennent à un pool partagé de PC cloud Windows 365 pré-provisionnés qui ne sont pas connectés à Entra-joint au locataire client. Les machines BYO doivent être provisionnées à l’avance dans le propre réseau virtuel du client. Vous devez enregistrer et gérer les machines BYO dans Power Automate.

Utilisez les machines BYO pour les scénarios de production. Ils prennent en charge Microsoft Entra ID, sont inscrits à Intune, et prennent en charge à la fois des cas d’utilisation de l’automatisation web et de bureau. Utilisez uniquement les machines hébergées pour le prototypage en raison de leurs capacités limitées. Un seul PC Cloud est disponible par utilisateur à la fois, et l’utilisation peut être limitée selon la demande.

Apprenez-en davantage sur Configurer les paramètres de fonctionnement de l’ordinateur.

Automatisation robotique des processus (RPA) vs. agents utilisant l’ordinateur (CUA)

L’automatisation robotique des processus (RPA) est l’automatisation d’un ordinateur à l’aide d’un script. Vous pouvez l’appliquer à beaucoup des mêmes scénarios que le CUA. Cependant, il est important de comprendre les différences entre RPA et CUA.

Aspect RPA CUA
Type d’automatisation Basé sur des règles Piloté par le LLM
Méthode d’interaction Arbre UI Vision
Création Scénario, complexe Instructions en langage naturel
Prise de décision Règles prédéfinies Décisions autonomes basées sur la vision
Flexibilité Flexibilité limitée Grande flexibilité
Gestion des erreurs Gestion des erreurs statiques Auto-correction basée sur le retour visuel

Utilisez la RPA lorsque :

  • Seules les fonctionnalités généralement disponibles (GA) sont autorisées.
  • L’interface utilisateur est stable. Les écrans, champs et sélecteurs changent rarement.
  • Les règles sont claires. Vous pouvez capturer les décisions dans des règles.
  • La vitesse compte. À fort volume. Chaque seconde compte.
  • Une équipe RPA en est propriétaire. L’équipe possède déjà des connaissances en développement et gestion RPA.

Utilisez le CUA lorsque :

  • Les interfaces utilisateur évoluent ou varient considérablement. Vous travaillez avec plusieurs applications et des redesigns fréquents.
  • Tu en as besoin vite. Le retard de l’équipe RPA est complet.
  • L’interface utilisateur compte. La tâche dépend de ce qui est visible à l’écran, comme les graphiques, les couleurs et les mises en page dynamiques.
  • Les décisions sont floues. L’agent doit raisonner, choisir l’étape suivante ou s’auto-corriger.