Partager via


Obtenez de l’aide pour coder avec l’Assistant Databricks

Cet article explique comment utiliser l’Assistant Databricks pour vous aider à coder et déboguer vos notebooks et fournit des conseils sur la façon de tirer le meilleur parti de l’Assistant.

Ce que l’Assistant Databricks peut faire pour vous

L’Assistant Databricks est un assistant IA prenant en charge le contexte avec lequel vous pouvez interagir à l’aide d’une interface conversationnelle, ce qui vous rend plus productif dans Databricks. Vous pouvez décrire votre tâche en anglais et laisser l’Assistant générer du code Python ou des requêtes SQL, expliquer le code complexe et corriger automatiquement les erreurs. L’assistant utilise les métadonnées du catalogue Unity pour comprendre vos tables, colonnes, descriptions et ressources de données populaires au sein de votre entreprise pour fournir des réponses personnalisées.

L’Assistant Databricks peut vous aider à effectuer les tâches suivantes :

  • Générez du code.
  • Déboguer le code, y compris l’identification et la suggestion de correctifs pour les erreurs.
  • Transformez et optimisez le code.
  • Expliquer le code.
  • Aidez-vous à trouver des informations pertinentes dans la documentation Azure Databricks.

Pour plus d’informations sur l’activation et l’utilisation de l’Assistant Databricks, consultez Activer et essayer l’Assistant Databricks. Pour obtenir des informations générales sur l’Assistant Databricks, consultez les fonctionnalités basées sur l’IA Databricks.

Raccourcis de commande de l'Assistant dans les notebooks

Dans un notebook, l’Assistant Databricks est disponible dans le volet Assistant ou en ligne dans une cellule de code.

Pour utiliser l’Assistant Databricks directement dans une cellule de code, appuyez sur Cmd+I sur MacOS ou Ctrl+I sur Windows. Une zone de texte apparaît dans la cellule. Vous pouvez taper une question ou un commentaire en anglais, puis appuyer sur Enter (pas Shift+Enter, comme vous le feriez pour exécuter une cellule) pour que l’Assistant génère une réponse.

L’Assistant Inline vous aide à identifier et à ajouter des données d’enrichissement.

Commandes à barre oblique pour les prompts

Les commandes à barre oblique sont des raccourcis pour créer vos prompts.

Prompt Ce que fait l'Assistant
/ Affiche les commandes courantes
/doc Commente le code dans une vue de comparaison
/explain Explique le code d’une cellule
/fix Propose un correctif pour toute erreur de code détectée dans une vue de comparaison
/findTables Recherche des tables pertinentes sur la base des métadonnées d’Unity Catalog Pour rechercher des fonctionnalités ou des tables de fonctionnalités, mentionnez « fonctionnalités » ou « tables de fonctionnalités » dans la requête. Consultez Rechercher des caractéristiques et des tables de caractéristiques à l’aide de l’Assistant Databricks.
/findQueries Recherche des requêtes pertinentes sur la base des métadonnées d’Unity Catalog
/optimize Améliore le code SQL et Python.
/prettify Reformate votre code pour une meilleure lisibilité.
/rename Suggère des noms actualisés pour les cellules du notebook et d’autres éléments, compte tenu du contexte.
/settings Ajuste les paramètres de votre notebook directement à partir de l’Assistant.

Lorsque vous utilisez /fix ou /doc, dans la fenêtre de comparaison, sélectionnez Accept pour accepter les modifications proposées ou Reject pour conserver votre code d’origine. Si vous acceptez le code proposé, celui-ci ne s’exécute pas automatiquement. Vous pouvez le passer en revue avant de l’exécuter. Si le code généré ne correspond pas à ce que vous souhaitez, réessayez en détaillant davantage votre commentaire. Consultez Conseils pour l’utilisation de l’Assistant Databricks.

Demandez des explications détaillées sur des extraits de code. Utilisez le prompt /explain et formulez une demande telle que « sois concis » ou « explique le code ligne par ligne » pour préciser le niveau de détail souhaité. Vous pouvez également demander à l’Assistant Databricks d’ajouter des commentaires au code.

Pour l’autocomplétion du code, les performances sont meilleures via le volet Assistant que dans une cellule du notebook.

L’Assistant se ferme automatiquement lorsque vous acceptez ou rejetez le code qu’il a généré.

Référencement de tables dans les prompts avec @

Pour référencer rapidement des tables dans vos prompts, utilisez le symbole @ (arobase).

Référencer des tables dans les prompts à l’aide du symbole @

Aide au codage

L’Assistant Databricks vous apporte son aide pour code, à la fois en SQL et en Python :

  • Autocomplétion basée sur l’IA dans des notebooks Databricks, dans l’éditeur SQL et dans l’éditeur de fichiers.
  • Filtrage des données avec des prompts en langage naturel.
  • Débogage de code avec Diagnose Error.

Suggestions de code en ligne : exemples Python et SQL

Lorsque vous tapez, les suggestions s’affichent automatiquement. Appuyez sur Tab pour accepter une suggestion. Pour déclencher manuellement une suggestion, appuyez sur Option+Shift+Space (sur macOS) ou sur Control+Shift+Space (sur Windows).

GIF animé illustrant l'autocomplétion du code en SQL.

GIF animé illustrant l'autocomplétion du code en Python.

L’autocomplétion basée sur l’IA peut également générer du code à partir de commentaires :

GIF animé illustrant l'autocomplétion du code à partir d’un commentaire.

Filtrage des données avec des prompts en langage naturel

Utilisez l’Assistant Databricks pour filtrer les sorties de données avec des prompts en langage naturel.

Pour filtrer les sorties en langage naturel, cliquez sur l’icône Filter dans la table de sortie et entrez un prompt. Par exemple, comme dans l'animation suivante, vous pouvez demander à ce que seuls soient pris en compte les hommes âgés de plus de 70 ans ».

Le GIF animé montre l’Assistant Databricks filtrant une table de survivants du Titanic de sorte à n'afficher que les hommes de plus de 70 ans.

Débogage de code : exemples Python et SQL

Pour utiliser l’Assistant Databricks pour corriger du code, procédez de l'une des manières suivantes :

  • Posez une question dans le volet Assistant.
  • Cliquez sur le bouton Diagnose Error qui s’affiche dans les résultats de cellule en cas d'erreur.
  • Cliquez sur Déboguer pour parcourir de manière interactive la ligne de code, définir des points d’arrêt, inspecter des variables et analyser l’exécution d’un programme.

Les onglets ci-dessous affichent des exemples d'erreur de diagnostic dans le code Python et SQL :

Python

Exemple de débogage par l’Assistant en Python.

SQL

Lorsque vous cliquez sur Diagnostiquer l’erreur, l’Assistant exécute automatiquement une commande « /fix ».

Exemple de débogage par l’Assistant en SQL.

Lorsque vous cliquez sur Diagnose error, l'Assistant exécute automatiquement /fix.

Optimiser le code Python, PySpark et SQL

À l'aide du prompt /optimize, évaluez et optimisez votre code Python, PySpark et SQL.

  1. Dans une cellule de notebook ou éditeur SQL, cliquez sur l'icône de l'Assistant Icône de l’Assistant dans le produit – couleur.
  2. Dans la zone d’invite, tapez /optimize, puis cliquez sur le bouton Générer .
  3. Pour utiliser les suggestions d’optimisation de l’Assistant, cliquez sur Accepter.

Utilisez l’invite d’optimisation sur un bloc-notes.

Voici comment /optimize vous aider avec le code :

  • Avertissements de préexécutation : Les soulignements jaunes mettent en évidence les possibilités d’optimiser votre requête avant l’exécution, par exemple lorsque vous ne filtrez pas sur une colonne de partition. Pointez sur le texte souligné pour afficher les suggestions d’optimisation.
  • Analyse post-exécution : Après avoir exécuté le code, cliquez sur le bouton Optimiser .
  • Suggestions pour les tables : par exemple, lorsque vous créez une table, vous recevez une recommandation CREATE TABLE CLUSTER BY AUTO.

Correction rapide

Lorsque le code retourne des erreurs, la fonction de correction rapide (Quick Fix) vous recommande automatiquement des corrections pour les erreurs de base pouvant être corrigées par une modification simple.

Cliquez sur Accept and run pour introduire la correction recommandé et continuer à exécuter votre code :

Capture d’écran de l’IU de correction de bogues en ligne de l’Assistant Databricks.

Conseils pour l’utilisation de l’Assistant Databricks

Cette section formule des conseils et bonnes pratiques à suivre dans le cadre de l'utilisation de l’Assistant Databricks.

L’Assistant Databricks utilise le contexte pour produire de meilleures réponses

L’Assistant Databricks a accès aux schémas et métadonnées des tables et des colonnes. Cela vous permet d’utiliser un langage naturel pour générer des requêtes plus précises. Par exemple, si une table contient une colonne nommée State, vous pouvez demander à l’Assistant Databricks de vous générer une liste des utilisateurs qui vivent dans l’État du Michigan.

L’Assistant Databricks utilise les contextes suivants :

  • Le code ou les requêtes présents dans la cellule du notebook ou dans l’onglet de l’éditeur SQL Databricks.
  • Les noms et descriptions des tables et des colonnes.
  • Les questions des prompts précédents.
  • Les tables favorites et actives.
  • Pour la fonctionnalité de diagnostic des erreurs, la trace de pile de la sortie d’erreur.

Lorsque vous sélectionnez des colonnes à partir d’un DataFrame, vous pouvez obtenir des résultats plus précis en fournissant une requête de départ. Par exemple, fournissez une instruction telle que SELECT * FROM <table_name>. Cela permettra à l’Assistant Databricks d’obtenir les noms de colonnes sans avoir à les deviner.

Comme l’assistant Databricks utilise l’historique de votre conversation pour fournir des réponses plus pertinentes et plus précises, vous pouvez lui demander de modifier la sortie d’une réponse précédente sans avoir à reformuler entièrement votre prompt. Utilisez l’historique des conversations de l’Assistant pour nettoyer, explorer, filtrer et découper des dataFrames de manière itérative dans le volet Assistant.

Soyez précis

La structure et le niveau de détail des réponses de l’Assistant Databricks peuvent varier, même pour un même prompt. Essayez de fournir autant d’indications que possible à l’Assistant afin d’obtenir les informations souhaitées dans le format, le niveau de détail, etc., que vous attendez. Exemple :

  • « Explique-moi ce code en quelques phrases » ou « Explique-moi ce code ligne par ligne ».
  • « Crée une visualisation avec Matplotlib » ou « Crée une visualisation avec Seaborn ».

Donnez des exemples de valeurs au niveau des lignes

Étant donné que l’Assistant Databricks n’utilise pas de données au niveau des lignes, vous devrez peut-être lui fournir des indications dans vos prompts pour obtenir des réponses plus précises. Utilisez les commentaires des tables ou colonnes dans le Catalog Explorer pour fournir un exemple de données. Par exemple, supposons que votre colonne Heigh soit au format feet-inches. Pour aider Assistant à interpréter les données, ajoutez un commentaire tel que « Les valeurs de la colonne Height sont des chaînes de caractères incluant un tiret de séparation. Exemple : « 6-2 ». Pour plus d’informations sur les commentaires de table et de colonne, consultez Ajouter des commentaires aux ressources d’IA et de données.

Si vous devez convertir le type de données d’une colonne pour effectuer une opération, il peut être utile de fournir des précisions. Par exemple : « convertit ce code de pandas en PySpark, en incluant le code nécessaire pour convertir le DataFrame pandas en DataFrame PySpark et en convertissant le type de la colonne Churn de booléen en entier ».

Utiliser Maj+Entrée pour ajouter une nouvelle ligne dans la zone de texte du chat

Utilisez Maj+Entrée pour insérer une nouvelle ligne dans la zone de saisie du chat de l’Assistant. Cela facilite le formatage et l’organisation de vos messages dans l’Assistant Databricks.

Modifiez et exécutez votre code dans le volet de chat de l’Assistant Databricks

Exécutez votre code dans le volet Assistant pour le valider ou l’utiliser comme bloc-notes. Pour exécuter votre code, cliquez sur icône d’exécution du code dans le coin supérieur gauche de la zone de code dans le volet Assistant.

Les onglets ci-dessous vous montrent des exemples de code Python et SQL :

Python

Exécution d'un code Python dans le volet Assistant.

SQL

Exécution d'un code SQL dans le volet Assistant.

Lorsque vous exécutez du code dans le volet Assistant, la sortie s’affiche et les variables deviennent utilisables dans le notebook.

Vous pouvez également modifier le code généré par l’Assistant Databricks directement dans la zone de chat de l’Assistant avant de déplacer le code vers le notebook.

Informations supplémentaires

Les articles suivants contiennent des informations supplémentaires sur l’utilisation de l’Assistant Databricks :