Partager via


Créer un assistant de données Fabric (préversion)

Avec un agent de données dans Microsoft Fabric, vous pouvez créer des expériences d’IA conversationnelle qui répondent aux questions sur les données stockées dans des lakehouses, des entrepôts, des modèles sémantiques Power BI et des bases de données KQL dans Fabric. Vos insights de données deviennent accessibles. Vos collègues peuvent poser des questions en anglais brut et recevoir des réponses pilotées par les données, même si elles ne sont pas des experts de l’IA ou connaissent bien les données.

Important

Cette fonctionnalité est en préversion.

Conditions préalables

Flux de bout en bout pour créer et consommer des agents de données Fabric

Cette section décrit les principales étapes à suivre pour créer, valider et partager un agent de données Fabric dans Fabric, ce qui le rend accessible pour la consommation.

Le processus est simple, et vous pouvez commencer à tester les ressources de l’agent de données Fabric en quelques minutes.

Créer un assistant de données Fabric

Pour créer un agent de données Fabric, accédez d’abord à votre espace de travail, puis sélectionnez le bouton + Nouvel élément. Sous l’onglet Tous les éléments, recherchez Agent de données Fabric pour rechercher l’option appropriée, comme illustré dans cette capture d’écran :

Capture d’écran montrant la création d’un agent de données Fabric.

Une fois sélectionné, vous êtes invité à fournir un nom pour votre agent de données Fabric, comme illustré dans cette capture d’écran :

Capture d’écran montrant comment fournir le nom de l’agent de données Fabric.

Reportez-vous à la capture d’écran fournie pour obtenir un guide visuel sur l’affectation d’un nom à l’agent de données Fabric. Après avoir entré le nom, passez à la configuration pour aligner l’agent de données Fabric avec vos exigences spécifiques.

Sélectionner vos données

Après avoir créé un agent de données Fabric, vous pouvez ajouter jusqu’à cinq sources de données, notamment des lakehouses, des entrepôts, des modèles sémantiques Power BI, et des bases de données KQL dans n’importe quelle combinaison. Par exemple, vous pouvez ajouter cinq modèles sémantiques Power BI, ou deux modèles sémantiques Power BI, un lakehouse et une base de données KQL.

Lorsque vous créez un agent de données Fabric pour la première fois et fournissez un nom, le catalogue OneLake s’affiche automatiquement, ce qui vous permet d’ajouter des sources de données. Pour ajouter une source de données, sélectionnez-la dans le catalogue comme indiqué dans l’écran suivant, puis sélectionnez Ajouter. Chaque source de données doit être ajoutée individuellement. Par exemple, vous pouvez ajouter un lakehouse, sélectionner Ajouter, puis continuer à ajouter une autre source de données. Pour filtrer les types de sources de données, sélectionnez l’icône de filtre, puis sélectionnez le type souhaité. Vous ne pouvez afficher que les sources de données du type sélectionné, ce qui facilite la localisation et la connexion des sources appropriées pour votre agent de données Fabric.

Une fois que vous avez ajouté la source de données, l’Explorateur dans le volet gauche de la page de l’agent de données Fabric remplit les tables disponibles dans chaque source de données sélectionnée, où vous pouvez utiliser les cases à cocher pour rendre les tables disponibles ou indisponibles pour l’IA, comme illustré dans la capture d’écran suivante :

Capture d’écran montrant comment ajouter des sources de données.

Remarque

Vous avez besoin d’une autorisation de lecture/écriture pour ajouter un modèle sémantique Power BI en tant que source de données à l’agent de données Fabric.

Pour les ajouts de sources de données suivants, accédez à l’Explorateur dans le volet gauche de la page de l’agent de données Fabric, puis sélectionnez + Source de données, comme illustré dans cette capture d’écran :

Capture d’écran montrant comment ajouter d’autres sources de données.

Le catalogue OneLake s’ouvre à nouveau et vous pouvez ajouter en toute transparence d’autres sources de données en fonction des besoins.

Conseil / Astuce

Veillez à utiliser des noms descriptifs pour les tables et les colonnes. Une table nommée SalesData est plus explicite que TableA, et les noms de colonnes comme ActiveCustomer ou IsCustomerActive sont plus clairs que C1 ou ActCu. Les noms descriptifs aident l’IA à générer des requêtes plus précises et fiables.

Poser des questions

Après avoir ajouté les sources de données et sélectionné les tables pertinentes pour chaque source de données, vous pouvez commencer à poser des questions. Le système gère les questions comme illustré dans cette capture d’écran :

Capture d’écran montrant une question pour un agent de données Fabric.

Les questions similaires à ces exemples doivent également fonctionner :

  • « Quelles sont nos ventes totales en Californie en 2023 ? »
  • « Quels sont les 5 premiers produits avec les prix de liste les plus élevés et quelles sont leurs catégories ? »
  • « Quels sont les articles les plus chers qui n’ont jamais été vendus ? »

Les questions comme celles-ci conviennent, car le système peut les traduire en requêtes structurées (T-SQL, DAX ou KQL), les exécuter sur des bases de données, puis retourner des réponses concrètes basées sur des données stockées.

En revanche, les questions comme celles-ci sont hors de portée :

  • « Pourquoi notre productivité d’usine est-elle inférieure au T2 2024 ? »
  • « Quelle est la cause racine de notre pic de ventes ? »

Ces questions sont actuellement hors de portée, car elles nécessitent un raisonnement complexe, une analyse de corrélation ou des facteurs externes non directement disponibles dans la base de données. L’agent de données Fabric n’effectue actuellement pas d’analyse avancée, d’apprentissage automatique ou d’inférence causale. Il récupère et traite simplement les données structurées en fonction de la requête de l’utilisateur.

Lorsque vous posez une question, l’agent de données Fabric utilise l’API Assistant Azure OpenAI pour traiter la requête. Le flux fonctionne de cette façon :

Accès au schéma avec les informations d’identification de l’utilisateur

Le système utilise d’abord les informations d’identification de l’utilisateur pour accéder au schéma de la source de données (par exemple, lakehouse, entrepôt, modèle sémantique PBI ou bases de données KQL). Cela garantit que le système extrait les informations de structure de données que l’utilisateur a l’autorisation d’afficher.

Construction du prompt

Pour interpréter la question de l’utilisateur, le système combine :

  1. Requête utilisateur : question de langage naturel fournie par l’utilisateur.
  2. Informations de schéma : métadonnées et détails structurels de la source de données récupérée à l’étape précédente.
  3. Exemples et instructions : exemples prédéfinis (par exemple, exemples de questions et réponses) ou instructions spécifiques fournies lors de la configuration de l’agent de données Fabric. Ces exemples et instructions permettent d’affiner la compréhension de la question par l’IA et de guider la façon dont l’IA interagit avec les données.

Toutes ces informations sont utilisées pour construire un prompt. Cette requête sert d’entrée à l’API de l’Assistant Azure OpenAI, qui se comporte comme un agent sous-jacent à l’agent de données Fabric. Cela indique essentiellement à l’agent de données Fabric comment traiter la requête, et le type de réponse à produire.

Appel d’outil en fonction des besoins des requêtes

L’agent analyse l’invite construite et décide de l’outil à appeler pour récupérer la réponse :

  • Langage naturel vers SQL (NL2SQL) : utilisé pour générer des requêtes SQL lorsque les données se trouvent dans un lakehouse ou un entrepôt
  • Langage naturel vers DAX (NL2DAX) : utilisé pour créer des requêtes DAX pour interagir avec des modèles sémantiques dans des sources de données Power BI
  • Langage naturel en KQL (NL2KQL) : utilisé pour construire des requêtes KQL pour interroger des données dans des bases de données KQL

L’outil sélectionné génère une requête à l’aide du schéma, des métadonnées et du contexte fournis par l’assistant sous-jacent à l’assistant de données Fabric. Ensuite, l’outil valide la requête, pour garantir une mise en forme et une conformité appropriées avec ses protocoles de sécurité, ainsi que ses propres stratégies d’IA responsable (RAI).

Construction de la réponse

L’agent sous-jacent à l’agent de données Fabric exécute la requête, et garantit que la réponse est structurée et mise en forme correctement. L’agent inclut souvent un contexte supplémentaire pour rendre la réponse conviviale. Enfin, la réponse s’affiche à l’utilisateur dans une interface conversationnelle, comme illustré dans la capture d’écran suivante :

Capture d’écran montrant la réponse à la question par un agent de données Fabric.

L’agent présente à la fois le résultat et les étapes intermédiaires qu’il a suivies pour récupérer la réponse finale. Cette approche améliore la transparence et permet la validation de ces étapes, si nécessaire. Les utilisateurs peuvent développer la liste déroulante des étapes afin d’afficher toutes les étapes effectuées par l’agent de données Fabric pour récupérer la réponse, comme illustré dans la capture d’écran suivante :

Capture d’écran montrant les étapes effectuées par un agent de données Fabric.

En outre, l’agent de données Fabric fournit le code généré utilisé pour interroger la source de données correspondante, ce qui fournit des informations supplémentaires sur la façon dont la réponse a été construite.

Ces requêtes sont conçues exclusivement pour interroger des données. Opérations impliquant

  • création de données
  • mises à jour des données
  • suppressions de données
  • tout type de modification de données

ne sont pas autorisés à protéger l’intégrité de vos données.

À tout moment, vous pouvez sélectionner le bouton Effacer la conversation pour effacer la conversation, comme illustré dans la capture d’écran suivante :

Capture d’écran mettant en évidence la fonctionnalité Effacer la conversation.

La fonctionnalité Effacer la conversation efface tout l’historique des conversations et démarre une nouvelle session. Une fois que vous avez supprimé votre historique de conversation, vous ne pouvez pas le récupérer.

Modifiez la source de données

Pour supprimer une source de données, pointez sur le nom de la source de données dans l’Explorateur dans le volet gauche de la page de l’agent de données Fabric jusqu’à ce que le menu à trois points s’affiche. Sélectionnez les trois points pour afficher les options, puis sélectionnez Supprimer pour supprimer la source de données, comme illustré dans la capture d’écran suivante :

Capture d’écran montrant comment supprimer ou actualiser des sources de données.

Sinon, si votre source de données a changé, vous pouvez sélectionner Actualiser dans le même menu, comme illustré dans la capture d’écran suivante :

Capture d’écran montrant comment actualiser une source de données.

Cela garantit que toutes les mises à jour de source de données sont à la fois reflétées et correctement renseignées dans l’Explorateur, pour que votre agent de données Fabric soit synchronisé avec les données les plus récentes.

Configuration de l’assistant de données Fabric

L’agent de données Fabric offre plusieurs options de configuration qui permettent aux utilisateurs de personnaliser son comportement afin de mieux répondre aux besoins de votre organisation. À mesure que l’agent de données Fabric traite et présente des données, ces configurations offrent une flexibilité qui permet un meilleur contrôle des résultats.

Fournir des instructions

Vous pouvez fournir des instructions spécifiques pour guider le comportement de l’IA. Pour les ajouter dans le volet d’instructions de l’agent de données Fabric, sélectionnez Instructions de l’agent de données, comme illustré dans la capture d’écran suivante :

Capture d’écran montrant la sélection du bouton Instructions de l’agent de données.

Ici, vous pouvez écrire jusqu’à 15 000 caractères en texte brut en anglais, pour indiquer à l’IA comment gérer les requêtes.

Par exemple, vous pouvez spécifier la source de données exacte à utiliser pour certains types de questions. Des exemples de choix de sources de données pourraient impliquer d'orienter l'IA à utiliser

  • Modèles sémantiques Power BI pour les requêtes financières
  • un lakehouse pour les données commerciales
  • une base de données KQL pour les métriques opérationnelles

Ces instructions garantissent que l’IA génère des requêtes appropriées, que ce soit SQL, DAX ou KQL, en fonction de vos conseils et du contexte des questions.

Si votre ressource IA interprète constamment de manière erronée certains mots, acronymes ou termes, vous pouvez essayer de fournir des définitions claires dans cette section pour vous assurer que l’IA les comprend et les traite correctement. Cela devient particulièrement utile pour la terminologie spécifique au domaine ou le jargon commercial unique.

En personnalisant ces instructions et en définissant des termes, vous améliorez la capacité de l’INTELLIGENCE artificielle à fournir des insights précis et pertinents, en alignement total avec votre stratégie de données et vos besoins métier.

Fournir des exemples de requêtes

Vous pouvez améliorer la justesse des réponses de l’agent de données Fabric lorsque vous fournissez des exemples de requêtes adaptés à chaque source de données, comme lakehouse, entrepôt et bases de données KQL. Cette approche, appelée Few-Shot Learning dans l’IA générative, aide à guider l’agent de données Fabric pour générer des réponses qui s’alignent mieux sur vos attentes.

Lorsque vous fournissez l’IA avec des paires d’exemples de requêtes/questions, elle fait référence à ces exemples lorsqu’elle répond à des questions futures. La mise en correspondance de nouvelles requêtes aux exemples les plus pertinents aide l’IA à incorporer une logique spécifique à l’entreprise et à répondre efficacement aux questions fréquemment posées. Cette fonctionnalité permet un réglage précis des sources de données individuelles et garantit la génération de requêtes SQL ou KQL plus précises.

Les données de modèle sémantique Power BI ne prennent pas en charge l’ajout d’exemples de paires requête/question pour l’instant. Toutefois, pour les sources de données prises en charge, telles que les bases de données lakehouse, warehouse et KQL, fournir plus d'exemples peut améliorer considérablement la capacité de l'IA à générer des requêtes précises lorsqu'un ajustement de ses performances par défaut est nécessaire.

Conseil / Astuce

Un ensemble diversifié d’exemples de requêtes améliore la capacité d’un agent de données Fabric à générer des requêtes SQL/KQL justes et pertinentes.

Pour ajouter ou modifier des exemples de requêtes, sélectionnez le bouton Exemples de requêtes pour ouvrir le volet Exemples de requêtes, comme illustré dans la capture d’écran suivante :

Capture d’écran montrant où modifier les exemples que vous fournissez à l’IA.

Ce volet fournit des options pour ajouter ou modifier des exemples de requêtes pour toutes les sources de données prises en charge, à l’exception des modèles sémantiques Power BI. Pour chaque source de données, vous pouvez sélectionner Ajouter ou modifier des exemples de requêtes pour entrer les exemples pertinents, comme illustré dans la capture d’écran suivante :

Capture d’écran montrant les exemples SQL que vous fournissez à l’IA.

Remarque

L’agent de données Fabric se réfère uniquement aux requêtes qui contiennent une syntaxe SQL/KQL valide et qui correspondent au schéma des tables sélectionnées. L’agent de données Fabric n’utilise pas de requêtes qui n’ont pas terminé leur validation. Assurez-vous que tous les exemples de requêtes sont valides et correctement alignés avec le schéma, afin de garantir que l’agent de données Fabric les utilise efficacement.

Publier et partager un agent de données Fabric

Une fois que vous avez testé les performances de votre agent de données Fabric avec différentes questions, et que vous avez confirmé qu’il génère des requêtes SQL, DAX ou KQL justes, vous pouvez le partager avec vos collègues. À ce stade, sélectionnez Publier, comme illustré dans la capture d’écran suivante :

Capture d’écran montrant la publication d’un agent de données Fabric.

Cette étape ouvre une fenêtre qui vous invite à fournir une description de l’agent de données Fabric. Ici, fournissez une description détaillée de ce que fait l’agent de données Fabric. Ces détails indiquent clairement à vos collègues quelles sont les fonctionnalités de l’agent de données Fabric, et ils aident d’autres orchestrateurs/systèmes IA à appeler efficacement l’agent de données Fabric.

Après avoir publié l’agent de données Fabric, vous en aurez deux versions. Une version est la version brouillon actuelle, que vous pouvez continuer à affiner et à améliorer. La deuxième version est la version publiée, que vous pouvez partager avec vos collègues qui souhaitent interroger l’agent de données Fabric pour obtenir des réponses à leurs questions. Vous pouvez incorporer des commentaires de vos collègues dans votre version brouillon actuelle à mesure que vous le développez, afin d’améliorer les performances de l’agent de données Fabric.