Adapter et étendre les agents d'intelligence artificielle pour le déploiement
Les modèles d’implémentation de l’unité précédente s’appliquent à chaque agent que vous générez. Toutefois, différents scénarios apportent des exigences différentes. Un agent côté client a besoin d’une finesse conversationnelle et de contrôles de confidentialité, tandis qu’un agent d’exploitation interne exige la fiabilité et la conformité. Cette unité explore comment adapter la configuration et le comportement de votre agent pour ces deux catégories de déploiement.
Agents côté client
Les agents qui interagissent directement avec les utilisateurs finaux, tels que le support client ou les assistants commerciaux, nécessitent une attention supplémentaire à la qualité des conversations, à la personnalisation et à la confidentialité.
Qualité de la conversation
L’invite système est votre outil principal pour contrôler la façon dont l’agent communique. Définissez le ton, le style et la longueur de réponse souhaités :
- Ton et style : incluez des instructions telles que « Répondre de manière conviviale et professionnelle » ou « Utiliser un langage simple et éviter le jargon technique ». Pour un agent de support, un ton empathique fonctionne bien. Pour un assistant commercial, un ton plus informatif peut être approprié.
- Clarification des questions : demandez à l’agent de demander des clarifications lorsqu’une demande est ambiguë plutôt que de deviner. Par exemple : « Si la demande de l’utilisateur n’est pas claire, posez une question de clarification polie avant de prendre des mesures ».
- Longueur de la réponse : guidez l’agent pour conserver les réponses concises : « Conservez les réponses sous trois phrases, sauf si l’utilisateur demande plus de détails ».
Ces recommandations peuvent être affinées de manière itérative. Testez les flux de conversation avec l’agent et ajustez l’invite système en fonction des résultats.
Personnalisation et confidentialité des données
Les agents côté client accèdent souvent à des données personnelles telles que l’historique des commandes et les détails du compte. Équilibrer la personnalisation avec la protection de la confidentialité :
- Injection de contexte utilisateur : quand une session démarre, injectez des informations utilisateur pertinentes via l’invite système ou le contexte initial. Par exemple, incluez le nom de l’utilisateur, le niveau de compte et l’historique des commandes récentes afin que l’agent puisse fournir un service personnalisé.
- Instructions de confidentialité : Ajoutez des règles explicites à l’invite système : « Discutez uniquement des données de compte de l’utilisateur connecté. Ne révèlez pas de codes de référence internes ni d’informations système sensibles.
- Réduction des données dans les outils : si un outil récupère des informations sensibles (comme une adresse complète), filtrez la réponse dans le gestionnaire d’outils pour retourner uniquement ce dont l’agent a besoin (comme la ville d’expédition).
Intégration des connaissances
Les agents de support et de vente ont souvent besoin d’accéder aux informations sur le produit, aux FAQ ou aux documents de stratégie qui vont au-delà des données d’entraînement du modèle IA. Le modèle Retrieval-Augmented Generation (RAG) répond à cette exigence en donnant à l’agent un outil de recherche :
- Définir un outil comme
search_knowledge_base(query)pour interroger votre documentation ou votre système de FAQ. - Demandez à l’agent (via l’invite système) d’utiliser cet outil lors de la réponse aux questions relatives au produit ou à la stratégie.
- Gardez la base de connaissances à jour pour éviter les réponses obsolètes.
Cette approche fait appel aux réponses de l’agent dans votre documentation réelle plutôt que de s’appuyer sur les données d’entraînement du modèle, ce qui réduit les réponses inexactes.
Passage de main humain
Même les agents bien configurés rencontrent des situations qu’ils ne peuvent pas résoudre. Créez un chemin d’escalade clair :
- Fournissez un
escalate_to_human(reason)outil qui transfère la conversation à un représentant humain avec tout le contexte collecté par l’agent. - Demandez à l’agent d’utiliser cet outil lorsqu’il ne peut pas résoudre une demande ou lorsque l’utilisateur demande explicitement un humain.
- Lors du déploiement initial, envisagez de router les réponses de l’agent par le biais d’une file d’attente de révision humaine avant d’atteindre le client, afin de renforcer la confiance dans la qualité de l’agent.
Back-office et agents autonomes
Les agents qui opèrent en arrière-plan, tels que l’automatisation financière, la gestion de la chaîne logistique ou les agents d’opérations informatiques, hiérarchisent la fiabilité, la précision et l’intégration aux systèmes d’entreprise par rapport à la qualité conversationnelle.
Déterminisme et vérification
Dans les processus d’entreprise, le comportement prévisible est essentiel :
-
Sorties structurées : interfaces d’outil de conception afin que l’agent fournit des valeurs de champ spécifiques plutôt que du texte de forme libre pour les entrées système. Par exemple, l’agent passe des paramètres structurés à un
create_journal_entry(account, amount, description)outil plutôt que de générer l’entrée entière sous forme de texte. -
Calculs dans le code : utilisez des outils pour toutes les opérations mathématiques plutôt que de compter sur le modèle IA. Un
calculate_tax(amount, rate)outil produit des résultats fiables, tandis que le modèle peut introduire des erreurs arithmétiques. - Validation historique : avant le déploiement, exécutez l’agent sur les données historiques connues et comparez ses décisions à ce que les humains ont fait. Les écarts vous aident à régler les seuils et les instructions.
Planification et déclencheurs
Contrairement aux agents interactifs, les agents back-office sont souvent démarrés par des événements ou des planifications plutôt que par une entrée utilisateur :
- Tâches planifiées : un travail cron ou un service planifié crée une session du Kit de développement logiciel (SDK) GitHub Copilot, fournit un contexte (par exemple, « effectuer la rapprochement de facture quotidienne ») et permet à l’agent d’exécuter.
- Piloté par les événements : une alerte de surveillance ou un webhook déclenche la création de session et envoie les détails de l’événement en tant qu’entrée. Chaque événement se voit généralement attribuer sa propre session pour éviter le mélange de contexte.
- Exécution sans état : traiter chaque tâche ou événement dans une session indépendante. Cette approche évite la confusion entre les opérations non liées.
Intégration du système d’entreprise
Les agents back-office interagissent fortement avec les API et les bases de données. Générez une robustesse dans vos gestionnaires d’outils :
- Nouvelles tentatives et délais d’expiration : implémentez une logique de nouvelle tentative avec une interruption exponentielle dans les gestionnaires d’outils qui appellent des systèmes externes.
- Sécurité des transactions : si l’agent effectue plusieurs écritures associées, envisagez d’utiliser un seul outil qui gère la transaction complète de manière atomique, plutôt que des outils distincts pour chaque étape.
- Accès avec privilège minimum : utilisez des comptes de service avec des autorisations minimales pour les appels d’API de l’agent. Cette approche limite l’effet d’un comportement inattendu.
- Journalisation de l’audit : journaliser toutes les actions effectuées par l’agent, y compris l’outil appelé, les paramètres passés et le résultat retourné. Incluez un identificateur qui marque l’action comme initiée par l’agent.
Surveillance humaine
Les agents autonomes doivent toujours avoir un filet de sécurité humaine :
-
Alertes : fournissez un
notify_manager(issue)outil que l’agent peut utiliser lorsqu’il rencontre des situations en dehors de sa formation ou lorsqu’un problème persiste après plusieurs tentatives. - Révision périodique : demandez aux experts du domaine de passer en revue régulièrement les décisions de l’agent, en particulier lors du déploiement précoce.
- Remplacement manuel : mettez en place un indicateur de fonctionnalité ou un commutateur de mode qui permet de faire passer rapidement l’agent du mode d’exécution autonome au mode consultatif, dans lequel il enregistre les recommandations mais ne prend aucune mesure.
Considérations relatives aux performances et aux coûts
Lorsque les agents s’exécutent fréquemment ou traitent de grands volumes, considérez ce qui suit :
- Sélection de modèle : utilisez un modèle plus rapide et moins coûteux pour les tâches de routine et réservez des modèles plus capables pour un raisonnement complexe. Le Kit de développement logiciel (SDK) vous permet de configurer le modèle par session.
- Traitement par lots : si un agent doit traiter de nombreux éléments, framez le travail dans une seule session plutôt que de créer une session distincte pour chaque élément.
- Modèles multi-agents : pour les flux de travail complexes, envisagez de fractionner les responsabilités entre plusieurs sessions avec différentes configurations et ensembles d’outils. Un agent peut gérer l’analyse alors qu’un autre gère l’exécution, votre application orchestrant entre eux.
Résumé
L’adaptation de votre agent IA pour différents scénarios de déploiement implique de personnaliser son style de conversation, son ensemble d’outils et ses modèles opérationnels pour répondre au cas d’usage. Les agents orientés client hiérarchisent la qualité et la personnalisation conversationnelles tout en conservant la confidentialité, tandis que les agents back-office se concentrent sur la fiabilité, l’intégration et l’opération autonome. En concevant votre agent avec ces considérations à l’esprit, vous pouvez optimiser son efficacité et sa valeur métier dans n’importe quel contexte. Dans l’unité suivante, vous verrez comment implémenter ces adaptations en pratique à l’aide du Kit de développement logiciel (SDK) GitHub Copilot.