Vue d’ensemble de Copilot pour la science des données et l’ingénierie des données (préversion)
Important
Cette fonctionnalité est en version préliminaire.
Copilot pour la science des données et l’ingénierie des données est un assistant IA qui permet d’analyser et de visualiser des données. Il fonctionne avec des tables et fichiers lakehouse, des jeux de données Power BI et des DataFrames pandas/spark/fabric, fournissant des réponses et des extraits de code directement dans le notebook. Le moyen le plus efficace d’utiliser Copilot consiste à ajouter vos données en tant que DataFrame. Vous pouvez poser vos questions dans le panneau de conversation, et l’IA fournit des réponses ou du code à copier dans votre notebook. Il comprend le schéma et les métadonnées de vos données, et si les données sont chargées dans un DataFrame, il a également conscience des données à l’intérieur de la trame de données. Vous pouvez demander à Copilot de fournir des insights sur les données, de créer du code pour les visualisations ou de fournir du code pour les transformations de données. De plus, il reconnaît les noms de fichiers pour une référence simple. Copilot simplifie l’analyse des données en éliminant le codage complexe.
Remarque
- Avant de commencer à utiliser Copilot, votre administrateur doit activer la commutation de locataire. Pour obtenir plus d’informations, consultez l’article CopilotParamètres du locataire .
- Votre capacité F64 ou P1 doit se trouver dans une des régions répertoriées dans cet article, Disponibilité des régions Fabric.
- Copilot est désactivé par défaut si votre locataire ou votre capacité sont situés en dehors des États-Unis ou de la France, à moins que l’administrateur de votre locataire Fabric n’active le paramètre Les données envoyées à Azure OpenAI peuvent être traitées en dehors de la région géographique de votre locataire, des limites de conformité ou de l’instance cloud nationale dans le portail d’administration de Fabric.
- Copilot dans Microsoft Fabric n’est pas pris en charge sur les références SKU d’essais gratuits. Seules les références SKU payantes (F64 ou ultérieures, ou P1 ou version ultérieure) sont prises en charge.
- Copilot in Fabric est actuellement déployé en préversion publique et devrait être disponible pour tous les clients à la fin mars 2024.
- Pour plus d’informations, consultez l’article Vue d’ensemble de Copilot dans Fabric et Power BI.
Introduction à Copilot pour la science des données et l’ingénierie des données pour Fabric Science des données
Avec Copilot pour la science des données et l’ingénierie des données, vous pouvez discuter avec un assistant IA qui peut vous aider à gérer vos tâches d’analyse et de visualisation des données. Vous pouvez poser des questions à Copilot sur les tables lakehouse, les jeux de données Power BI ou les DataFrames Pandas/Spark à l’intérieur des notebooks. Copilot répond en langage naturel ou en extraits de code. Copilot peut également générer du code spécifique à vos données, en fonction de la tâche. Par exemple, Copilot pour la science des données et l’ingénierie des données peut générer du code pour :
- Créer des graphiques
- Filtrage des données
- Appliquer des transformations
- Modèles Machine Learning
Tout d’abord, sélectionnez l’icône Copilot dans le ruban du notebook. Le volet de conversation Copilot s’ouvre et une nouvelle cellule apparaît en haut de votre notebook. Cette cellule doit s’exécuter chaque fois qu’une session Spark se charge dans un notebook Fabric. Sinon, l’expérience Copilot ne fonctionne pas correctement. Nous sommes en train d’évaluer d’autres mécanismes pour gérer cette initialisation requise pour les versions ultérieures.
Exécutez la cellule en haut du notebook, en utilisant ce code :
#Run this cell to install the required packages for Copilot
%pip install https://aka.ms/chat-magics-0.0.0-py3-none-any.whl
%load_ext chat_magics
Une fois la cellule exécutée, vous pouvez utiliser Copilot. Vous devez réexécuter la cellule en haut du notebook chaque fois que votre session dans le notebook se ferme.
Pour optimiser l’efficacité de Copilot, chargez une table ou un jeu de données en tant que DataFrame dans votre notebook. De cette façon, l’IA peut accéder aux données et comprendre sa structure et son contenu. Ensuite, commencez à discuter avec l’IA. Sélectionnez l’icône de conversation dans la barre d’outils du notebook, puis tapez votre question ou demande dans le panneau de conversation. Par exemple, vous pouvez demander :
- « Quel est l’âge moyen des clients dans ce jeu de données ? »
- « Afficher un graphique à barres des ventes par région »
Et plus encore. Copilot répond avec la réponse ou le code, que vous pouvez copier et coller dans votre notebook. Copilot pour la science des données et l’ingénierie des données est un moyen pratique et interactif d’explorer et d’analyser vos données.
Lorsque vous utilisez Copilot, vous pouvez également appeler les commandes magiques à l’intérieur d’une cellule de notebook pour obtenir la sortie directement dans le notebook. Par exemple, pour les réponses en langage naturel, vous pouvez poser des questions à l’aide de la commande « %%chat », par exemple :
%%chat
What are some machine learning models that may fit this dataset?
or
%%code
Can you generate code for a logistic regression that fits this data?
Copilot pour la science des données et l’ingénierie des données a également une compréhension du schéma et des métadonnées des tables dans le lakehouse. Copilot peut fournir des informations pertinentes dans le contexte de vos données dans un lakehouse attaché. Par exemple, vous pouvez demander :
- « Combien de tables se trouvent dans le lac ? »
- « Quelles sont les colonnes de la table customers ? »
Copilot répond avec les informations pertinentes si vous avez ajouté le lakehouse au notebook. Copilot a également conscience des noms de fichiers ajoutés à n’importe quel lakehouse attaché au notebook. Vous pouvez faire référence à ces fichiers par nom dans votre conversation. Par exemple, si vous avez un fichier nommé sales.csv dans votre lakehouse, vous pouvez demander « Créer un DataFrame à partir de sales.csv ». Copilot génère le code et l’affiche dans le volet de conversation. Avec Copilot pour les notebooks, vous pouvez facilement accéder à vos données et les interroger à partir de différentes sources. Vous n’avez pas besoin de la syntaxe de commande exacte pour le faire.
Conseils
- « Effacez » votre conversation dans le panneau de conversation Copilot avec le balai situé en haut du volet de conversation. Copilot conserve la connaissances des entrées ou sorties pendant la session, mais cela vous aide si le contenu actuel vous distrait.
- Utilisez la bibliothèque chat-magics pour configurer les paramètres sur Copilot, y compris les paramètres de confidentialité. Le mode de partage par défaut est conçu pour optimiser le partage de contexte auquel Copilot a accès, de sorte que la limitation des informations fournies à copilot peut directement et significativement avoir un impact sur la pertinence de ses réponses.
- Lorsque Copilot se lance pour la première fois, il propose un ensemble d’invites utiles qui peuvent vous aider à commencer. Elles peuvent vous aider à lancer votre conversation avec Copilot. Pour faire référence aux invites ultérieurement, vous pouvez utiliser le bouton étincelle en bas du panneau de conversation.
- Vous pouvez « faire glisser » la barre latérale de la conversation copilot pour développer le panneau de conversation, pour afficher le code plus clairement ou pour la lisibilité des sorties sur votre écran.
Limites
Les fonctionnalités de Copilot dans l’expérience de la science des données sont actuellement étendues aux notebooks. Ces fonctionnalités incluent le volet de conversation Copilot, les commandes magiques IPython qui peuvent être utilisées dans une cellule de code et les suggestions de code automatiques lorsque vous tapez une cellule de code. Copilot peut également lire des modèles sémantiques Power BI à l’aide d’une intégration de lien sémantique.
Copilot a deux utilisations principales :
- D’abord, vous pouvez demander à Copilot d’examiner et d’analyser des données dans votre notebook (par exemple, en chargeant d’abord un DataFrame, puis en demandant à Copilot sur les données à l’intérieur du DataFrame).
- Deuxièmement, vous pouvez demander à Copilot de générer une série de suggestions sur votre processus d’analyse des données, telles que les modèles prédictifs susceptibles d’être pertinents, le code pour effectuer différents types d’analyse des données et la documentation d’un notebook terminé.
N’oubliez pas que la génération de code avec des bibliothèques rapides ou récemment publiées peut inclure des inexactitudes ou des fabrications.