Partager via


Qu’est-ce que l’Assistant Databricks ?

Important

Cette fonctionnalité est disponible en préversion publique.

L’Assistant Databricks est un programmeur compagnon basé sur l’IA et un agent d’assistance qui vous rend plus efficace pour créer des notebooks, des requêtes et des fichiers. Il peut vous aider à répondre rapidement aux questions en générant, en optimisant, en complétant, en expliquant et en corrigeant le code et les requêtes.

Cette page fournit des informations générales sur l’Assistant. Pour toute question sur la confidentialité et la sécurité, consultez Confidentialité et sécurité.

Fonctionnalités basées sur Azure AI Services et fonctionnalités basées sur Databricks

L’Assistant Databricks est une collection de fonctionnalités basées sur l’IA qui augmentent la productivité pour un large éventail de tâches.

Certaines fonctionnalités de l’Assistant proviennent d’Azure AI Services, ce qui signifie qu’elles s’appuient sur des modèles non pris en charge par Databricks. Le tableau suivant décrit les fonctionnalités de l’Assistant et le fournisseur de modèles pour chaque fonctionnalité.

Fonctionnalité de l’Assistant Description de la fonctionnalité Fournisseur de modèles
Conversation de l’Assistant Un panneau de conversation IA disponible partout dans le produit pour vous aider à effectuer différentes tâches. Azure AI Services
Prompts d’actions de cellule de l’Assistant Transformations en langage naturel du code dans une cellule. Azure AI Services
Autocomplétion basée sur l’IA de l’Assistant Suggestions de code inline au fil de la frappe. Databricks

Activer ou désactiver les fonctionnalités Azure AI Services de l’Assistant au niveau du compte

Les fonctionnalités Azure AI Services de l’Assistant Databricks sont activées par défaut. Cependant, les administrateurs peuvent désactiver les fonctionnalités Azure AI Services de l’Assistant pour tous les espaces de travail au sein d’un compte :

Conseil

L’activation ou la désactivation des fonctionnalités Azure AI Services de l’Assistant Databricks pour votre compte est capturée en tant qu’événement de compte dans vos journaux d’audit ; consultez Événements de compte.

  1. En tant qu’administrateur de compte, connectez-vous à la console de compte.

    Important

    Si aucun utilisateur de votre locataire Microsoft Entra ID (anciennement Azure Active Directory) n’est encore connecté à la console de compte, vous ou un autre utilisateur de votre locataire devez vous connecter comme premier administrateur de compte. Pour ce faire, vous devez être Administrateur général Microsoft Entra ID, mais uniquement quand vous vous connectez pour la première fois à la console de compte Azure Databricks. Dès la première connexion, vous devenez administrateur de compte Azure Databricks et n’avez plus besoin du rôle Administrateur général Microsoft Entra ID pour accéder au compte Azure Databricks. En tant que premier administrateur de compte, vous pouvez attribuer des utilisateurs dans le locataire Microsoft Entra ID comme administrateurs de compte supplémentaires (qui peuvent eux-mêmes attribuer davantage d’administrateurs de compte). Les administrateurs de compte supplémentaires ne nécessitent pas de rôles spécifiques dans Microsoft Entra ID. Consultez Gérer les utilisateurs, les principaux de service et les groupes.

  2. Cliquez sur Paramètres.

  3. Cliquez sur l’onglet Activation des fonctionnalités.

  4. Pour l’option fonctionnalités d’assistance d’IA basées sur Azure AI , sélectionnez activé ou Désactivé, puis cliquez sur Enregistrer.

Activer ou désactiver les fonctionnalités de l’Assistant au niveau de l’utilisateur

Tous les utilisateurs, y compris les non-administrateurs, peuvent activer ou désactiver les fonctionnalités de l’Assistant pour leur profil utilisateur dans les paramètres Développeur :

  1. Cliquez sur votre nom d’utilisateur dans la barre supérieure de l’espace de travail Databricks, puis sélectionnez >Paramètres.
  2. Sous Utilisateur, cliquez sur l’onglet Développeur.
  3. Sous Fonctionnalités expérimentales, vous pouvez trouver des bascules pour Autocomplétion de l’Assistant Databricks et Nouvel assistant.

Obtenir de l’aide sur le codage à partir de l’Assistant Databricks

Pour accéder à l’Assistant Databricks, cliquez sur l’icône d’Assistant icône de l’Assistant Databricks dans la barre latérale gauche du notebook, de l’éditeur de fichiers, de l’éditeur SQL ou de l’onglet Données du tableau de bord.

Emplacement de l’icône de l’Assistant Databricks

Le volet Assistant peut s’ouvrir sur le côté gauche ou droit de l’écran.

Volet Assistant Databricks

Certaines fonctionnalités de l’Assistant Databricks sont les suivantes :

  • Générer : utilisez le langage naturel pour générer une requête SQL.
  • Expliquer : mettez en surbrillance une requête ou un bloc de code et faites en sorte que l’Assistant Databricks parcoure la logique en anglais clair et concis.
  • Correctif : expliquez et corrigez les erreurs de syntaxe et de runtime en un seul clic.
  • Transformer et optimiser : convertissez du code Pandas en PySpark pour une exécution plus rapide.

Tout code généré par l’Assistant Databricks est destiné à s’exécuter dans un environnement de calcul Databricks. Il est optimisé pour créer du code dans des langages de programmation, des frameworks et des dialectes pris en charge par Databricks. Il n’est pas destiné à être un assistant de programmation à usage général. L’Assistant utilise souvent des informations provenant de ressources Databricks, telles que le site web de la documentation Databricks ou la Base de connaissances, pour mieux répondre aux requêtes des utilisateurs. Il est plus performant lorsque la question de l’utilisateur est liée aux questions qui peuvent être répondues à l’aide des connaissances de la documentation Databricks, du catalogue Unity et du code utilisateur dans l’espace de travail.

Les utilisateurs doivent toujours passer en revue tout code généré par l’Assistant avant de l’exécuter, car il peut parfois faire des erreurs.

Créer des visualisations de données à l’aide de l’Assistant Databricks

Vous pouvez utiliser l’Assistant Databricks lors de l’élaboration de tableaux de bord. Quand vous créez des visualisations sur un jeu de données de tableau de bord existant, interrogez l’Assistant avec des questions à répondre sous forme de graphiques générés. Pour utiliser l’Assistant dans un tableau de bord, créez d’abord un ou plusieurs jeux de données, puis ajoutez un widget de visualisation dans le canevas. Le widget de visualisation comprend une invite pour décrire votre nouveau graphique. Tapez la description du graphique que vous souhaitez voir pour que l’assistant le génère. Vous pouvez approuver ou refuser le graphique, ou modifier la description pour générer quelque chose de nouveau.

Si vous souhaitez obtenir des informations et des exemples sur l’utilisation de l’Assistant avec des tableaux de bord, consultez Créer des visualisations avec l’Assistant Databricks.

Services utilisés par l’Assistant Databricks

L’assistant Databricks utilise les services Azure OpenAI pour fournir des réponses.

Le service Azure OpenAI est géré par Microsoft, pas OpenAI, et est soumis à leurs stratégies de gestion des données respectives. Les données envoyées à ce service ne sont pas utilisées pour l’apprentissage de modèle. Pour obtenir plus de détails, consultez la stratégie de gestion des données Azure.

Pour Azure OpenAI, Azure Databricks a choisi de ne pas utiliser la surveillance des abus, donc aucune invite ou réponse n’est stockée avec Azure OpenAI.

Conseils pour améliorer la précision des résultats

  • Utilisez l’invite “Rechercher des tables” pour obtenir de meilleures réponses. Avant de poser des questions sur les données d’une table, demandez à l’Assistant de rechercher des tables associées par sujet ou d’autres caractéristiques. Exemple : Find tables related to NFL games.

  • Spécifiez la structure de la réponse souhaitée. La structure et les détails que l’Assistant Databricks fournit varient, même pour la même invite. L’Assistant Databricks connaît votre schéma de table et de colonne et vos métadonnées. Vous pouvez donc utiliser le langage naturel pour poser votre question. Exemple : réponses de l’Assistant List active and retired NFL quarterbacks' passing completion rate, for those who had over 500 attempts in a season. à l’aide de données provenant de colonnes telles que s.player_id et s.attempts.

  • Fournissez des exemples de vos valeurs de données au niveau des lignes. Databricks Assistant n'a pas accès aux données au niveau des lignes, donc pour des réponses plus précises, fournissez des exemples de données. Exemple : List the average height for each position in inches. Cela renvoie une erreur, car le jeu de données affiche la hauteur en pieds et pouces, comme dans 6-2.

  • Testez les extraits de code en les exécutant dans le volet Assistant. Utilisez le volet Assistant comme bloc-notes qui enregistre les itérations de vos requêtes et réponses de l’Assistant. Vous pouvez exécuter du code et le modifier dans le volet jusqu’à ce que vous soyez prêt à l’ajouter à un bloc-notes.

    Test des extraits de code en les exécutant dans le volet Assistant.

  • Utilisez des actions de cellule dans un bloc-notes. Les actions de cellule incluent des raccourcis vers des tâches courantes, telles que la documentation (commentaires), la correction et l’explication du code.

    L’action de cellule /doc invite l’Assistant à commenter le code.

Pour obtenir des exemples entièrement illustrés, consultez 5 conseils pour l’Assistant Databricks.

L’Assistant Databricks prend en compte l’historique de la conversation afin que vous puissiez affiner vos questions au fur et à mesure.

Envoyer des commentaires

La meilleure façon d’envoyer des commentaires consiste à utiliser les liens Fournir des commentaires dans le notebook et l’éditeur SQL. Vous pouvez également envoyer un e-mail à assistant-feedback@databricks.com ou à votre équipe de compte.

Partagez des suggestions d’amélioration du produit et des problèmes d’expérience utilisateur plutôt que des commentaires sur la précision de l’invite. Si vous recevez une suggestion inutile de l'Assistant, cliquez sur le bouton Icône De pouce vers le bas « Pas utile ».

Disponibilité géographique des fonctionnalités de l’Assistant

L’Assistant Databricks est un service désigné qui utilise des zones géographiques pour gérer la résidence des données lors du traitement du contenu de clients. Pour en savoir plus sur la disponibilité des fonctionnalités de l’Assistant dans différentes zones géographiques, consultez Services désignés Databricks.

Confidentialité et sécurité

Q : Quelles données sont envoyées aux modèles ?

L’Assistant Databricks envoie du code et des métadonnées aux modèles sur chaque requête d’API. Cela permet de retourner des résultats plus pertinents pour vos données. Voici quelques exemples :

  • Code/requêtes dans la cellule de notebook active ou l’onglet Éditeur SQL
  • Noms et descriptions des tables et des colonnes
  • Questions précédentes
  • Tables favorites

Q : Les métadonnées envoyées aux modèles respectent-elles les autorisations du catalogue Unity de l’utilisateur ?

Oui, toutes les données envoyées au modèle respectent les autorisations du catalogue Unity de l’utilisateur. Aucune métadonnée relative aux tables pour lesquelles l’utilisateur n’est pas autorisé n’est envoyée.

Q : Si j’exécute une requête avec des résultats, puis que je pose une question, les résultats de ma requête sont-ils envoyés au modèle ?

Non, seul le contenu du code dans les cellules, les métadonnées relatives aux tables et le texte entré par l’utilisateur sont partagés avec le modèle. Pour la fonctionnalité « corriger l’erreur », Databricks partage également l’arborescence des appels de procédure à partir de la sortie de l’erreur.

Q : L’Assistant Databricks exécutera-t-il du code dangereux ?

Non. L’Assistant Databricks n’exécute pas automatiquement le code en votre nom. Les modèles IA peuvent faire des erreurs, mal comprendre l’intention et halluciner ou donner des réponses incorrectes. Passez en revue et testez le code généré par l’IA avant de l’exécuter.

Q : Databricks a-t-il effectué une évaluation pour évaluer la précision et l’adéquation des réponses de l’Assistant ?

Oui. Databricks dispose d’atténuations pour empêcher l’Assistant de générer des réponses dangereuses telles qu’un discours haineux, du code non sécurisé, des jailbreaks d’invite et du contenu de droits d’auteur tiers. Databricks a effectué des tests approfondis de toutes nos fonctionnalités d’assistance IA avec des milliers d’entrées utilisateur simulées pour évaluer la robustesse des atténuations. Ces évaluations se sont concentrées sur les cas d’usage attendus pour l’Assistant, comme la génération de code dans les langages Python, Databricks SQL, R et Scala.

Q : Puis-je utiliser l’Assistant Databricks avec des tables qui traitent des données réglementées (PHI, PCI, IRAP, FedRAMP) ?

Oui. Pour cela, vous devez respecter les exigences, telles que l’activation du profil de sécurité de conformité, et ajouter la norme de conformité appropriée dans le cadre de la configuration du profil de sécurité de conformité.