Présentation des applications IA génératives sur Databricks

2025-05-09

Mosaic AI prend en charge les applications d'IA de génération simple et complexe, des chatbots utilisant la génération augmentée par récupération (RAG) aux agents d'appel d'outils. Découvrez les concepts clés derrière les applications et systèmes d’agent d’IA gen, explorez les modèles de conception courants et familiarisez-vous avec les didacticiels permettant de créer, d’évaluer et de mettre à l’échelle des applications IA gen.

Apprendre les concepts des applications d'IA générative

Familiarisez-vous avec les concepts fondamentaux de l’application IA de génération.

Qu’est-ce que les applications IA de génération ?

Découvrez comment Mosaïque AI résout les principaux défis lors du développement d’IA de génération.

Essayez de créer des applications IA gen avec Mosaïque AI

Commencez avec les tutoriels de notebook suivants :

Lorsque vous êtes prêt à plus de complexité, consultez les guides et didacticiels avancés :

Qu’est-ce que les applications IA de génération ?

Une application IA de génération est une application qui utilise des modèles IA génératifs (tels que des modèles LLMs, des modèles de génération d’images et des modèles de synthèse vocale) pour créer de nouvelles sorties, automatiser des tâches complexes ou engager des interactions intelligentes en fonction de l’entrée utilisateur. Bien que les applications IA de génération puissent utiliser différents modèles, ce guide se concentre sur les applications basées sur LLM.

Bien que les applications d’intelligence artificielle de génération LLM puissent être créées de différentes manières, elles se trouvent généralement sous l’un des deux modèles architecturaux suivants :

	Type 1 : LLM monolithique + invite	Type 2 (recommandé) : système agent
Qu’est-ce que c’est ?	Un seul LLM avec des instructions soigneusement conçues.	Plusieurs composants interagissants (appels LLM, récupérateurs, appels d’API) orchestrés ensemble, allant de chaînes simples à des systèmes multi-agents sophistiqués.
Exemple de cas d’usage	Classification du contenu : Utilisation d’un LLM pour catégoriser les tickets de support client en rubriques prédéfinies.	Assistant intelligent : combinaison de la récupération de documents, de l’appel à plusieurs LLM et d’API externes pour rechercher, analyser et générer des rapports complets.
Idéal pour	Tâches simples, ciblées, prototypes rapides et invites claires et bien définies.	Flux de travail complexes, tâches nécessitant plusieurs fonctionnalités et tâches nécessitant une réflexion sur les étapes précédentes.
avantages clés	Implémentation plus simple, développement plus rapide et complexité opérationnelle plus faible.	Amélioration de la fiabilité et de la maintenance, meilleur contrôle et flexibilité, plus facile à tester et vérifier, et optimisation au niveau des composants.
Limitations	Moins flexible, plus difficile à optimiser et à des fonctionnalités limitées.	Implémentation plus complexe, configuration initiale et coordination des composants.

Pour la plupart des cas d’utilisation d’entreprise, Databricks recommande un système d’agent . En cassant les systèmes en composants plus petits et bien définis, les développeurs peuvent mieux gérer la complexité tout en conservant des niveaux élevés de contrôle et de conformité requis pour les applications d’entreprise.

Mosaïque AI dispose d’outils et de fonctionnalités qui fonctionnent pour les systèmes monolithiques et les systèmes d’agent, et le reste de cette documentation couvre la création des deux types d’applications IA de génération.

Pour en savoir plus sur la théorie des systèmes d’agent par rapport aux modèles monolithiques, consultez les billets de blog des fondateurs de Databricks :

Qu’est-ce qu’un système d’agent ?

Un système d’agent est un système piloté par l’IA qui peut percevoir, décider et agir de manière autonome dans un environnement pour atteindre les objectifs. Contrairement à un LLM autonome qui produit uniquement une sortie lorsqu’il y est invité, un système d’agent possède un degré d’agence. Les systèmes d’agents modernes basés sur des LLM utilisent un LLM comme « cerveau » pour interpréter le contexte, raisonner sur les étapes à suivre et émettre des actions telles que les appels d’API, les mécanismes de recherche et les invocations d’outils pour effectuer des tâches.

Un système d’agent est un système avec un LLM à son cœur. Ce système :

Reçoit des demandes d’utilisateur ou des messages d’un autre agent.
Raisons de la procédure à suivre : quelles données récupérer, quelle logique appliquer, quels outils appeler ou si vous souhaitez demander plus d’entrée de l’utilisateur.
Exécute un plan et peut appeler plusieurs outils ou délègue à des sous-agents.
Retourne une réponse ou invite l’utilisateur à obtenir des précisions supplémentaires.

En pontant l’intelligence générale (les fonctionnalités préentraînées du LLM) et l’intelligence des données (connaissances spécialisées et API spécifiques à votre entreprise), les systèmes d’agent permettent des cas d’usage d’entreprise à fort impact, tels que des flux de service client avancés, des bots d’analytique enrichis de données et l’orchestration multi-agent pour des tâches opérationnelles complexes.

Que peut faire un système d’agent ?

Un système d’agent peut :

Planifier dynamiquement des actions
Porter l’état d’une étape à la suivante
Ajuster sa stratégie basée sur de nouvelles informations sans intervention humaine continue

Lorsqu’un LLM autonome peut générer un itinéraire de voyage lorsqu’il est demandé, un système d’agent peut récupérer les informations client et réserver les vols de manière autonome en tirant parti des outils et DES API. En combinant « l’intelligence générale » du LLM avec «l’intelligence des données» (données ou API spécifiques au domaine), les systèmes d’agent peuvent s’attaquer à des cas d’usage d’entreprise sophistiqués qu’un modèle statique unique lutte pour résoudre.

L'agence est un continuum : plus vous donnez de liberté aux modèles pour contrôler le comportement du système, plus l'application devient agentive. Dans la pratique, la plupart des systèmes de production limitent soigneusement l’autonomie de l’agent pour garantir la conformité et la prévisibilité, par exemple en exigeant une approbation humaine pour les actions risquées.

Intelligence générale et intelligence des données

Diagramme comparant l’intelligence générale et l’intelligence des données.

Intelligence générale : fait référence à ce que le LLM connaît intrinsèquement d'un préentraînement étendu sur des textes diversifiés. Cela est utile pour la fluidité de la langue et le raisonnement général.
Intelligence des données : Fait référence aux données et API spécifiques au domaine de votre organisation. Cela peut inclure des enregistrements client, des informations sur les produits, des bases de connaissances ou des documents qui reflètent votre environnement d’entreprise unique.

Les systèmes d’agent mélangent ces deux perspectives : ils commencent par les connaissances générales et génériques d’un LLM, puis apportent des données en temps réel ou spécifiques au domaine pour répondre à des questions détaillées ou effectuer des actions spécialisées.

Exemple de système d’agent

Organigramme de l'interaction des clients avec l'application d'IA générative.

Envisagez un scénario de centre d’appels entre un client et un agent IA de génération :

Le client effectue une demande : « Pouvez-vous m’aider à retourner ma dernière commande ? »

Motif et plan : étant donné l’intention de la requête, l’agent « plans » : « Recherchez la commande récente de l’utilisateur et vérifiez notre stratégie de retour ».
Rechercher des informations (intelligence des données) : l’agent interroge la base de données de commande pour récupérer l’ordre approprié et référence un document de stratégie.
Motif : l’agent vérifie si cette commande s’adapte à la fenêtre de retour.
- Facultatif human-in-the-loop : L’agent vérifie une règle supplémentaire : si l’élément tombe dans une certaine catégorie ou se trouve en dehors de la fenêtre de retour normale, passez à un humain.
Action: l’agent déclenche le processus de retour et génère une étiquette d’expédition.
Motif: l’agent génère une réponse au client.

L’agent IA répond au client : « Terminé ! » Voici votre étiquette d’expédition...

Ces étapes sont de deuxième nature dans un contexte de centre d’appels humain . Dans le contexte d'un système d'agents , le LLM « raisonne » tandis que le système fait appel à des outils ou des sources de données spécialisées pour renseigner les détails.

Outils et sources de données utilisés par le système d’agent.

Niveaux de complexité : des LLM aux systèmes d’agent

Vous pouvez rencontrer plusieurs niveaux de complexité lors de la création de systèmes IA.

LLM (LLM + Prompt)
- Un LLM autonome répond aux incitations textuelles en fonction des connaissances d'un vaste jeu de données d'apprentissage.
- Convient pour les requêtes simples ou génériques, mais souvent déconnectées de vos données métier réelles.
système d’agent codé en dur (« Chaîne »)
- Les développeurs orchestrent des étapes déterministes et prédéfinies. Par exemple, une application RAG peut toujours recueillir des données à partir d'un stockage de vecteurs et combiner les résultats avec l'invite de l'utilisateur.
- La logique est fixe et le LLM ne décide pas de l’outil à appeler ensuite.
Système d’agent avec appel d’outils
- Le LLM décide quel outil utiliser et quand l’utiliser au moment de l’exécution.
- Cette approche prend en charge les décisions dynamiques et contextuelles sur les outils à appeler, tels qu’une base de données CRM ou une API de publication Slack.
systèmes multi-agents
- Plusieurs agents spécialisés, chacun avec sa propre fonction ou domaine.
- Un coordonnateur (parfois un superviseur d'IA, ou parfois basé sur des règles) décide de quel agent appeler à chaque étape.
- Les agents peuvent se transmettre les tâches tout en préservant le flux de conversation global.

Lors de la création d’une application basée sur LLM, démarrez simple. Introduisez des comportements agentiques plus complexes lorsque vous en avez vraiment besoin pour une meilleure flexibilité ou des décisions basées sur des modèles. Les chaînes déterministes offrent des flux prédictibles basés sur des règles pour des tâches bien définies, tandis que d’autres approches agentiques se présentent au coût d’une complexité supplémentaire et d’une latence potentielle.

Mosaïque AI Agent Framework est indépendant de ces modèles, ce qui facilite le démarrage et l’évolution vers des niveaux plus élevés d’automatisation et d’autonomie à mesure que vos besoins en application augmentent.

Outils dans un système d’agent

Dans le contexte d’un système d’agent, les outils sont des fonctions à interaction unique qu’un LLM peut utiliser pour accomplir une tâche bien définie. Le modèle IA génère généralement des paramètres pour chaque appel d’outil, et l’outil fournit une interaction de sortie d’entrée simple. Il n’y a pas de mémoire multi tour côté outil.

Voici quelques catégories d’outils courantes :

outils qui récupèrent ou analysent des données
- Outils de récupération de vecteurs : Interroger un index vectoriel pour localiser les blocs de texte les plus pertinents.
- outils de récupération structurée : interroger des tables Delta ou utiliser des API pour récupérer des informations structurées.
- outil de recherche web : Rechercher sur Internet ou un corpus web interne.
- Modèles ML classiques : Outils qui appellent des modèles ML pour effectuer des prédictions de classification ou de régression, comme un modèle scikit-learn ou XGBoost.
- Modèles d’IA gen : Outils qui effectuent une génération spécialisée, comme le code ou la génération d’images, et retournent les résultats.
Outils qui modifient l’état d’un système externe
- Outil d’appel d’API : Points de terminaison CRM, services internes ou autres intégrations tierces pour des tâches telles que « mettre à jour le statut de l’expédition ».
- outil d’exécution de code : exécute le code fourni par l’utilisateur (ou dans certains cas généré par LLM) dans un bac à sable.
- L'intégration Slack ou par e-mail : publie un message ou envoie une notification.
Outils qui exécutent une logique ou effectuent une tâche spécifique
- Outil exécuteur de code : Exécute du code généré par l’utilisateur ou généré par LLM dans un bac à sable, tel que des scripts Python.

Pour en savoir plus sur les outils de l'agent IA Mosaic, consultez outils d’agent IA.

Caractéristiques clés des outils

Outils dans un système d’agent :

Effectuez une opération unique et bien définie.
Ne conservez pas de contexte continu au-delà de cette invocation.
Autoriser le système d’agent à atteindre des données externes ou des services auxquels le LLM ne peut pas accéder directement.

Gestion et sécurité des erreurs des outils

Étant donné que chaque appel d’outil est une opération externe, par exemple, l’appel d’une API, le système doit gérer correctement les défaillances, telles que les délais d’attente, la gestion des erreurs de gestion des réponses incorrectes ou les entrées non valides. En production, limitez le nombre d’appels d’outils autorisés, ayez une réponse de secours si tous les appels d’outil échouent et appliquez des garde-fous pour vous assurer que le système d’agent ne tente pas à plusieurs reprises la même action défaillante.