Concepts de l’agent de données Fabric (version préliminaire)

2025-07-08

L’assistant de données dans Microsoft Fabric est une nouvelle fonctionnalité Microsoft Fabric qui vous permet de créer vos propres systèmes questions et réponses conversationnels à l’aide de l’IA générative. Un assistant de données Fabric rend les insights de données plus accessibles et exploitables pour tous les membres de votre organisation. Avec un assistant de données Fabric, votre équipe peut avoir des conversations, avec des questions purement en langue anglaise, sur les données stockées par votre organisation dans Fabric OneLake, puis recevoir des réponses pertinentes. De cette façon, même les personnes sans expertise technique en IA ou sans compréhension approfondie de la structure des données peuvent recevoir des réponses précises et riches en contexte.

Vous pouvez également ajouter des instructions, des exemples et des conseils spécifiques à l’organisation pour affiner l’assistant de données Fabric. Cela garantit que les réponses s’alignent sur les besoins et les objectifs de votre organisation, ce qui permet à tout le monde d’interagir plus efficacement avec les données. L’assistant de données Fabric favorise une culture de la prise de décision basée sur les données, car il réduit les obstacles à l’accessibilité des insights, facilite la collaboration et permet à votre organisation d’extraire plus de valeur de ses données.

Important

Cette fonctionnalité est en version préliminaire.

Conditions préalables

Une ressource de capacité Fabric F2 payante ou supérieure
Les paramètres du locataire de l'agent de données Fabric sont activés.
Commutateur de locataire Copilot activé.
Le traitement intergéographique pour l’IA est activé.
Le stockage multi-régional pour l’IA est activé.
Au moins un d'entre eux : un entrepôt, un lakehouse, un ou plusieurs modèles sémantiques Power BI ou une base de données KQL avec des données.
Les modèles sémantiques Power BI via le commutateur de locataire des points de terminaison XMLA sont activés pour les sources de données de modèle sémantique Power BI.

Fonctionnement de l’assistant de données Fabric

L’assistant de données Fabric utilise des grands modèles de langage (LLM) pour aider les utilisateurs à interagir naturellement avec leurs données. L’assistant de données Fabric applique les API de l’Assistant Azure OpenAI et se comporte comme un assistant. Il traite les questions utilisateur, détermine la source de données la plus pertinente (lakehouse, entrepôt, jeu de données Power BI, bases de données KQL) et appelle l’outil approprié pour générer, valider et exécuter des requêtes. Les utilisateurs peuvent ensuite poser des questions purement en anglais et recevoir des réponses structurées et lisibles par les utilisateurs, ce qui élimine la nécessité d’écrire des requêtes complexes et garantit un accès précis et sécurisé aux données.

Voici comment cela fonctionne en détail :

Analyse des questions et validation : l’assistant de données Fabric applique les API de l’Assistant Azure OpenAI en tant qu’assistant sous-jacent pour traiter les questions utilisateur. Cette approche garantit que la question est conforme aux protocoles de sécurité, aux stratégies d’IA responsable et aux autorisations utilisateur. L'agent de données Fabric applique strictement l'accès en lecture seule, maintenant des connexions de données en lecture seule à toutes les sources de données.

Identification de la source de données : l’assistant de données Fabric utilise les informations d’identification de l’utilisateur pour accéder au schéma de la source de données. Cela garantit que le système extrait les informations de structure de données que l’utilisateur a l’autorisation d’afficher. Il évalue ensuite la question de l’utilisateur sur toutes les sources de données disponibles, notamment les bases de données relationnelles (lakehouse et entrepôt), les jeux de données Power BI (modèles sémantiques) et les bases de données KQL. Il peut également faire référence aux instructions de l’assistant de données fournies par l’utilisateur pour déterminer la source de données la plus pertinente.

Appel de l’outil et génération de requête : une fois que la ou les sources de données correctes sont identifiées, l’assistant de données Fabric reformule la question pour plus de clarté et de structure, puis appelle l’outil correspondant pour générer une requête structurée :

Langage naturel vers SQL (NL2SQL) pour les bases de données relationnelles (lakehouse/entrepôt).
Langage naturel vers DAX (NL2DAX) pour les jeux de données Power BI (modèles sémantiques).
Langage naturel en KQL (NL2KQL) pour les bases de données KQL.

L’outil sélectionné génère une requête basée sur le schéma, les métadonnées et le contexte fournis que l’assistant sous-jacent à l’assistant de données Fabric transmet ensuite.

Validation de requête : l’outil effectue la validation pour s’assurer que la requête est correctement formée et adhère à ses propres protocoles de sécurité et stratégies d’IA responsable.

Exécution de la requête et réponse : une fois la validation terminée, l’assistant de données Fabric exécute la requête sur la source de données choisie. Les résultats sont mis en forme dans une réponse lisible par les utilisateurs, qui peut inclure des données structurées telles que des tables, des résumés ou des insights clés.

Cette approche garantit que les utilisateurs peuvent interagir avec leurs données à l’aide du langage naturel, tandis que l’assistant de données Fabric gère les complexités de la génération, de la validation et de l’exécution des requêtes, sans que les utilisateurs n’écrivent de langage SQL, DAX ou KQL eux-mêmes.

Configuration de l’assistant de données Fabric

La configuration d’un assistant de données Fabric est similaire à la création d’un rapport Power BI. Vous commencez par le créer et l’affiner pour vous assurer qu’il répond à vos besoins, puis le publiez et le partagez avec vos collègues afin qu’ils puissent interagir avec les données. La configuration d’un assistant de données Fabric implique :

Sélectionner les sources de données : un assistant de données Fabric prend en charge jusqu’à cinq sources de données dans n’importe quelle combinaison, notamment les lakehouses, les entrepôts, les bases de données KQL et les modèles sémantiques Power BI. Par exemple, un assistant de données Fabric configuré peut inclure cinq modèles sémantiques Power BI. Il peut inclure un mélange de deux modèles sémantiques Power BI, un lakehouse et une base de données KQL. Vous disposez de nombreuses options.

Choisir les tables pertinentes : après avoir sélectionné les sources de données, vous devez les ajouter une par une et définir les tables spécifiques de chaque source que l’assistant de données Fabric utilisera. Cette étape garantit que l’assistant de données Fabric récupère des résultats précis en se concentrant uniquement sur les données pertinentes.

Ajouter du contexte : pour améliorer la précision de l’assistant de données Fabric, vous pouvez fournir davantage de contexte via des instructions et des exemples de requêtes de l’assistant de données Fabric. En tant qu’assistant sous-jacent pour l’assistant de données Fabric, le contexte aide l’API de l’Assistant Azure OpenAI à prendre des décisions plus éclairées sur la façon de traiter les questions utilisateur et à déterminer la source de données la plus pertinente pour y répondre.

Instructions de l’assistant de données : vous pouvez ajouter des instructions pour guider l’assistant sous-jacent à l’assistant de données Fabric en déterminant la meilleure source de données pour répondre à des types de questions spécifiques. Vous pouvez également fournir des règles ou des définitions personnalisées pour clarifier la terminologie ou des exigences spécifiques de l’organisation. Ces instructions peuvent fournir plus de contexte ou de préférences qui influencent la façon dont l’assistant sélectionne et interroge des sources de données.
- Questions directes sur les métriques financières vers un modèle sémantique Power BI.
- Attribuez des requêtes impliquant l’exploration de données brutes au lakehouse.
- Routez les questions nécessitant une analyse des journaux vers la base de données KQL.
Exemples de requêtes : vous pouvez ajouter des exemples de paires question-requête pour illustrer la façon dont l’assistant de données Fabric doit répondre aux requêtes courantes. Ces exemples servent de guide pour l’assistant, ce qui lui permet de comprendre comment interpréter des questions similaires et générer des réponses précises.

Remarque

L'ajout d'exemples de paires requête/question n'est actuellement pas pris en charge pour les sources de données du modèle sémantique Power BI.

En combinant des instructions d’IA claires et des exemples de requêtes pertinents, vous pouvez mieux aligner l’agent de données Fabric avec les besoins de données de votre organisation, ce qui garantit des réponses plus précises et plus contextuelles.

Différence entre un assistant de données Fabric et un copilote

Bien que les assistants de données Fabric et les copilotes Fabric utilisent l’IA générative pour traiter et raisonner sur les données, il existe des différences clés dans leurs fonctionnalités et leurs cas d’usage :

Flexibilité de la configuration : les assistants de données Fabric sont hautement configurables. Vous pouvez fournir des instructions et des exemples personnalisés pour adapter leur comportement à des scénarios spécifiques. Les copilotes Fabric, quant à eux, sont préconfigurés et ne proposent pas ce niveau de personnalisation.

Étendue et cas d’usage : les copilotes Fabric sont conçus pour faciliter les tâches au sein de Microsoft Fabric, telles que la génération de code de notebook ou de requêtes d’entrepôt. Les assistants de données Fabric, en revanche, sont des artefacts autonomes. Pour rendre les assistants de données Fabric plus polyvalents pour des cas d’usage plus larges, il est possible de les intégrer à des systèmes externes tels que Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams ou d’autres outils en dehors de Fabric.

Évaluation de l’assistant de données Fabric

La qualité et la sécurité des réponses de l’assistant de données Fabric ont fait l’objet d’une évaluation rigoureuse :

Test de benchmark : l’équipe produit a testé des assistants de données Fabric dans une gamme de jeux de données publics et privés pour garantir des réponses de haute qualité et précises.

Atténuations améliorées des préjudices : d’autres mesures de protection sont en place pour s’assurer que les sorties de l’assistant de données Fabric restent axées sur le contexte des sources de données sélectionnées, afin de réduire le risque de réponses non pertinentes ou trompeuses.

Limites

L’assistant de données Fabric est actuellement en préversion publique et présente des limitations. Des mises à jour futures permettront d’améliorer l’assistant de données Fabric au fil du temps.

L’assistant de données Fabric génère uniquement des requêtes de lecture SQL/DAX/KQL. Il ne génère pas de requêtes SQL/DAX/KQL qui créent, mettent à jour ou suppriment des données.
Fabric Data Agent ne prend pas en charge les données non structurées (.pdf, .docxou .txt). Vous ne pouvez pas utiliser l’assistant de données Fabric pour accéder à des ressources de données non structurées. Ces ressources peuvent être par exemple des fichiers .pdf, .docx ou .txt.
L’agent de données Fabric ne prend actuellement pas en charge les langues non anglaises. Pour des performances optimales, fournissez des questions, des instructions et des exemples de requêtes en anglais.
Vous ne pouvez pas modifier le LLM que l’assistant de données Fabric utilise.

Partager via