Notes
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cet article explique comment utiliser l’Assistant Databricks pour vous aider à coder et déboguer vos notebooks et fournit des conseils sur la façon de tirer le meilleur parti de l’Assistant.
Ce que l’Assistant Databricks peut faire pour vous
L’Assistant Databricks est un assistant IA prenant en charge le contexte avec lequel vous pouvez interagir à l’aide d’une interface conversationnelle, ce qui vous rend plus productif dans Databricks. Vous pouvez décrire votre tâche en anglais et laisser l’Assistant générer du code Python ou des requêtes SQL, expliquer le code complexe et corriger automatiquement les erreurs. L’assistant utilise les métadonnées du catalogue Unity pour comprendre vos tables, colonnes, descriptions et ressources de données populaires au sein de votre entreprise pour fournir des réponses personnalisées.
L’Assistant Databricks peut vous aider à effectuer les tâches suivantes :
- Générez du code.
- Déboguer le code, y compris l’identification et la suggestion de correctifs pour les erreurs.
- Transformez et optimisez le code.
- Expliquer le code.
- Aidez-vous à trouver des informations pertinentes dans la documentation Azure Databricks.
Pour plus d’informations sur l’activation et l’utilisation de l’Assistant Databricks, consultez Activer et essayer l’Assistant Databricks. Pour obtenir des informations générales sur l’Assistant Databricks, consultez les fonctionnalités basées sur l’IA Databricks.
Raccourcis de commande de l'Assistant dans les notebooks
Dans un notebook, l’Assistant Databricks est disponible dans le volet Assistant ou en ligne dans une cellule de code.
Pour utiliser l’Assistant Databricks directement dans une cellule de code, appuyez sur Cmd+I
sur MacOS ou Ctrl+I
sur Windows. Une zone de texte apparaît dans la cellule. Vous pouvez taper une question ou un commentaire en anglais, puis appuyer sur Enter
(pas Shift+Enter
, comme vous le feriez pour exécuter une cellule) pour que l’Assistant génère une réponse.
Commandes à barre oblique pour les prompts
Les commandes à barre oblique sont des raccourcis pour créer vos prompts.
Prompt | Ce que fait l'Assistant |
---|---|
/ |
Affiche les commandes courantes |
/doc |
Commente le code dans une vue de comparaison |
/explain |
Explique le code d’une cellule |
/fix |
Propose un correctif pour toute erreur de code détectée dans une vue de comparaison |
/findTables |
Recherche des tables pertinentes sur la base des métadonnées d’Unity Catalog Pour rechercher des fonctionnalités ou des tables de fonctionnalités, mentionnez « fonctionnalités » ou « tables de fonctionnalités » dans la requête. Consultez Rechercher des caractéristiques et des tables de caractéristiques à l’aide de l’Assistant Databricks. |
/findQueries |
Recherche des requêtes pertinentes sur la base des métadonnées d’Unity Catalog |
/optimize |
Améliore le code SQL et Python. |
/prettify |
Reformate votre code pour une meilleure lisibilité. |
/rename |
Suggère des noms actualisés pour les cellules du notebook et d’autres éléments, compte tenu du contexte. |
/settings |
Ajuste les paramètres de votre notebook directement à partir de l’Assistant. |
Lorsque vous utilisez /fix
ou /doc
, dans la fenêtre de comparaison, sélectionnez Accept pour accepter les modifications proposées ou Reject pour conserver votre code d’origine. Si vous acceptez le code proposé, celui-ci ne s’exécute pas automatiquement. Vous pouvez le passer en revue avant de l’exécuter. Si le code généré ne correspond pas à ce que vous souhaitez, réessayez en détaillant davantage votre commentaire. Consultez Conseils pour l’utilisation de l’Assistant Databricks.
Demandez des explications détaillées sur des extraits de code. Utilisez le prompt /explain
et formulez une demande telle que « sois concis » ou « explique le code ligne par ligne » pour préciser le niveau de détail souhaité. Vous pouvez également demander à l’Assistant Databricks d’ajouter des commentaires au code.
Pour l’autocomplétion du code, les performances sont meilleures via le volet Assistant que dans une cellule du notebook.
L’Assistant se ferme automatiquement lorsque vous acceptez ou rejetez le code qu’il a généré.
Référencement de tables dans les prompts avec @
Pour référencer rapidement des tables dans vos prompts, utilisez le symbole @
(arobase).
Aide au codage
L’Assistant Databricks vous apporte son aide pour code, à la fois en SQL et en Python :
- Autocomplétion basée sur l’IA dans des notebooks Databricks, dans l’éditeur SQL et dans l’éditeur de fichiers.
- Filtrage des données avec des prompts en langage naturel.
- Débogage de code avec Diagnose Error.
Suggestions de code en ligne : exemples Python et SQL
Lorsque vous tapez, les suggestions s’affichent automatiquement. Appuyez sur Tab
pour accepter une suggestion. Pour déclencher manuellement une suggestion, appuyez sur Option+Shift+Space
(sur macOS) ou sur Control+Shift+Space
(sur Windows).
L’autocomplétion basée sur l’IA peut également générer du code à partir de commentaires :
Filtrage des données avec des prompts en langage naturel
Utilisez l’Assistant Databricks pour filtrer les sorties de données avec des prompts en langage naturel.
Pour filtrer les sorties en langage naturel, cliquez sur l’icône Filter dans la table de sortie et entrez un prompt. Par exemple, comme dans l'animation suivante, vous pouvez demander à ce que seuls soient pris en compte les hommes âgés de plus de 70 ans ».
Débogage de code : exemples Python et SQL
Pour utiliser l’Assistant Databricks pour corriger du code, procédez de l'une des manières suivantes :
- Posez une question dans le volet Assistant.
- Cliquez sur le bouton Diagnose Error qui s’affiche dans les résultats de cellule en cas d'erreur.
- Cliquez sur Déboguer pour parcourir de manière interactive la ligne de code, définir des points d’arrêt, inspecter des variables et analyser l’exécution d’un programme.
Les onglets ci-dessous affichent des exemples d'erreur de diagnostic dans le code Python et SQL :
Python
SQL
Lorsque vous cliquez sur Diagnostiquer l’erreur, l’Assistant exécute automatiquement une commande « /fix ».
Lorsque vous cliquez sur Diagnose error, l'Assistant exécute automatiquement /fix
.
Optimiser le code Python, PySpark et SQL
À l'aide du prompt /optimize
, évaluez et optimisez votre code Python, PySpark et SQL.
- Dans une cellule de notebook ou éditeur SQL, cliquez sur l'icône de l'Assistant
.
- Dans la zone d’invite, tapez
/optimize
, puis cliquez sur le bouton Générer . - Pour utiliser les suggestions d’optimisation de l’Assistant, cliquez sur Accepter.
Voici comment /optimize
vous aider avec le code :
- Avertissements de préexécutation : Les soulignements jaunes mettent en évidence les possibilités d’optimiser votre requête avant l’exécution, par exemple lorsque vous ne filtrez pas sur une colonne de partition. Pointez sur le texte souligné pour afficher les suggestions d’optimisation.
- Analyse post-exécution : Après avoir exécuté le code, cliquez sur le bouton Optimiser .
- Suggestions pour les tables : par exemple, lorsque vous créez une table, vous recevez une recommandation
CREATE TABLE CLUSTER BY AUTO
.
Correction rapide
Lorsque le code retourne des erreurs, la fonction de correction rapide (Quick Fix) vous recommande automatiquement des corrections pour les erreurs de base pouvant être corrigées par une modification simple.
Cliquez sur Accept and run pour introduire la correction recommandé et continuer à exécuter votre code :
Conseils pour l’utilisation de l’Assistant Databricks
Cette section formule des conseils et bonnes pratiques à suivre dans le cadre de l'utilisation de l’Assistant Databricks.
L’Assistant Databricks utilise le contexte pour produire de meilleures réponses
L’Assistant Databricks a accès aux schémas et métadonnées des tables et des colonnes. Cela vous permet d’utiliser un langage naturel pour générer des requêtes plus précises. Par exemple, si une table contient une colonne nommée State, vous pouvez demander à l’Assistant Databricks de vous générer une liste des utilisateurs qui vivent dans l’État du Michigan.
L’Assistant Databricks utilise les contextes suivants :
- Le code ou les requêtes présents dans la cellule du notebook ou dans l’onglet de l’éditeur SQL Databricks.
- Les noms et descriptions des tables et des colonnes.
- Les questions des prompts précédents.
- Les tables favorites et actives.
- Pour la fonctionnalité de diagnostic des erreurs, la trace de pile de la sortie d’erreur.
Lorsque vous sélectionnez des colonnes à partir d’un DataFrame, vous pouvez obtenir des résultats plus précis en fournissant une requête de départ. Par exemple, fournissez une instruction telle que SELECT * FROM <table_name>
. Cela permettra à l’Assistant Databricks d’obtenir les noms de colonnes sans avoir à les deviner.
Comme l’assistant Databricks utilise l’historique de votre conversation pour fournir des réponses plus pertinentes et plus précises, vous pouvez lui demander de modifier la sortie d’une réponse précédente sans avoir à reformuler entièrement votre prompt. Utilisez l’historique des conversations de l’Assistant pour nettoyer, explorer, filtrer et découper des dataFrames de manière itérative dans le volet Assistant.
Soyez précis
La structure et le niveau de détail des réponses de l’Assistant Databricks peuvent varier, même pour un même prompt. Essayez de fournir autant d’indications que possible à l’Assistant afin d’obtenir les informations souhaitées dans le format, le niveau de détail, etc., que vous attendez. Exemple :
- « Explique-moi ce code en quelques phrases » ou « Explique-moi ce code ligne par ligne ».
- « Crée une visualisation avec Matplotlib » ou « Crée une visualisation avec Seaborn ».
Donnez des exemples de valeurs au niveau des lignes
Étant donné que l’Assistant Databricks n’utilise pas de données au niveau des lignes, vous devrez peut-être lui fournir des indications dans vos prompts pour obtenir des réponses plus précises. Utilisez les commentaires des tables ou colonnes dans le Catalog Explorer pour fournir un exemple de données. Par exemple, supposons que votre colonne Heigh soit au format feet
-inches
. Pour aider Assistant à interpréter les données, ajoutez un commentaire tel que « Les valeurs de la colonne Height sont des chaînes de caractères incluant un tiret de séparation. Exemple : « 6-2 ». Pour plus d’informations sur les commentaires de table et de colonne, consultez Ajouter des commentaires aux ressources d’IA et de données.
Si vous devez convertir le type de données d’une colonne pour effectuer une opération, il peut être utile de fournir des précisions. Par exemple : « convertit ce code de pandas en PySpark, en incluant le code nécessaire pour convertir le DataFrame pandas en DataFrame PySpark et en convertissant le type de la colonne Churn de booléen en entier ».
Utiliser Maj+Entrée pour ajouter une nouvelle ligne dans la zone de texte du chat
Utilisez Maj+Entrée pour insérer une nouvelle ligne dans la zone de saisie du chat de l’Assistant. Cela facilite le formatage et l’organisation de vos messages dans l’Assistant Databricks.
Modifiez et exécutez votre code dans le volet de chat de l’Assistant Databricks
Exécutez votre code dans le volet Assistant pour le valider ou l’utiliser comme bloc-notes. Pour exécuter votre code, cliquez sur dans le coin supérieur gauche de la zone de code dans le volet Assistant.
Les onglets ci-dessous vous montrent des exemples de code Python et SQL :
Python
SQL
Lorsque vous exécutez du code dans le volet Assistant, la sortie s’affiche et les variables deviennent utilisables dans le notebook.
Vous pouvez également modifier le code généré par l’Assistant Databricks directement dans la zone de chat de l’Assistant avant de déplacer le code vers le notebook.
Informations supplémentaires
Les articles suivants contiennent des informations supplémentaires sur l’utilisation de l’Assistant Databricks :