Partager via


Qu’est-ce que l’Assistant Databricks ?

L’Assistant Databricks est un outil de programmation en binôme et un agent de support basés sur l’IA qui vous permet de créer plus efficacement des notebooks, des requêtes, des tableaux de bord et des fichiers. Il peut vous aider à répondre rapidement aux questions en générant, en optimisant, en complétant, en expliquant et en corrigeant le code et les requêtes.

Cette page fournit des informations générales sur l’Assistant. Pour toute question sur la confidentialité et la sécurité, consultez Confidentialité et sécurité.

Comment l’Assistant Databricks peut-il vous aider ?

L’Assistant Databricks peut vous aider à accomplir les tâches suivantes :

Assistant utilise les métadonnées Unity Catalog pour comprendre vos tables, colonnes, descriptions et ressources de données populaires au sein de votre entreprise pour fournir des réponses personnalisées.

Le code généré par l’Assistant Databricks est destiné à s’exécuter dans un environnement de calcul Databricks. Il est optimisé pour créer du code dans des langages de programmation, des frameworks et des dialectes pris en charge par Databricks. Il n’est pas destiné à être un assistant de programmation à usage général. L’Assistant utilise souvent des informations provenant de ressources Databricks, telles que le site web de la documentation Databricks ou la Base de connaissances, pour mieux répondre aux requêtes des utilisateurs. Il est plus performant lorsque la question de l’utilisateur est liée aux questions qui peuvent être répondues à l’aide des connaissances de la documentation Databricks, du catalogue Unity et du code utilisateur dans l’espace de travail.

Obtenir de l’aide sur le codage à partir de l’Assistant Databricks

Pour accéder à l’Assistant Databricks, cliquez sur l’icône de l’Assistant Icône de l’Assistant dans le produit (couleur) dans la barre latérale gauche du notebook, de l’éditeur de fichiers, de l’éditeur SQL ou de l’onglet Données du tableau de bord.

Emplacement de l’icône et du panneau de l’Assistant Databricks

Le volet Assistant peut s’ouvrir sur le côté gauche ou droit de l’écran.

Les utilisateurs doivent toujours passer en revue tout code généré par l’Assistant avant de l’exécuter, car il peut parfois faire des erreurs.

Créer des visualisations de données à l’aide de l’Assistant Databricks

Vous pouvez utiliser l’Assistant Databricks lors de l’élaboration de tableaux de bord. Quand vous créez des visualisations sur un jeu de données de tableau de bord existant, interrogez l’Assistant avec des questions à répondre sous forme de graphiques générés. Pour utiliser l’Assistant dans un tableau de bord, créez d’abord un ou plusieurs jeux de données, puis ajoutez un widget de visualisation dans le canevas. Le widget de visualisation comprend une invite pour décrire votre nouveau graphique. Tapez la description du graphique que vous souhaitez voir pour que l’assistant le génère. Vous pouvez approuver ou refuser le graphique, ou modifier la description pour générer quelque chose de nouveau.

Si vous souhaitez obtenir des informations et des exemples sur l’utilisation de l’Assistant avec des tableaux de bord, consultez Créer des visualisations avec l’Assistant Databricks.

Services utilisés par l’Assistant Databricks

L’assistant Databricks utilise les services Azure OpenAI pour fournir des réponses.

Le service Azure OpenAI est géré par Microsoft, pas OpenAI, et est soumis à leurs stratégies de gestion des données respectives. Les données envoyées à ce service ne sont pas utilisées pour l’apprentissage de modèle. Pour obtenir plus de détails, consultez la stratégie de gestion des données Azure.

Pour Azure OpenAI, Azure Databricks a choisi de ne pas utiliser la surveillance des abus, donc aucune invite ou réponse n’est stockée avec Azure OpenAI.

Conseils pour améliorer la précision des résultats

  • Utilisez l’invite “Rechercher des tables” pour obtenir de meilleures réponses. Avant de poser des questions sur les données d’une table, demandez à l’Assistant de rechercher des tables associées par sujet ou d’autres caractéristiques. Exemple : Find tables related to NFL games.

  • Spécifiez la structure de la réponse souhaitée. La structure et les détails que l’Assistant Databricks fournit varient, même pour la même invite. L’Assistant Databricks connaît votre schéma de table et de colonne et vos métadonnées. Vous pouvez donc utiliser le langage naturel pour poser votre question. Exemple : réponses de l’Assistant List active and retired NFL quarterbacks' passing completion rate, for those who had over 500 attempts in a season. à l’aide de données provenant de colonnes telles que s.player_id et s.attempts.

  • Fournissez des exemples de vos valeurs de données au niveau des lignes. Databricks Assistant n'a pas accès aux données au niveau des lignes, donc pour des réponses plus précises, fournissez des exemples de données. Exemple : List the average height for each position in inches. Cela renvoie une erreur, car le jeu de données affiche la hauteur en pieds et pouces, comme dans 6-2.

  • Testez les extraits de code en les exécutant dans le volet Assistant. Utilisez le volet Assistant comme bloc-notes qui enregistre les itérations de vos requêtes et réponses de l’Assistant. Vous pouvez exécuter du code et le modifier dans le volet jusqu’à ce que vous soyez prêt à l’ajouter à un bloc-notes.

    Test des extraits de code en les exécutant dans le volet Assistant.

  • Utilisez des actions de cellule dans un bloc-notes. Les actions de cellule incluent des raccourcis vers des tâches courantes, telles que la documentation (commentaires), la correction et l’explication du code.

    L’action de cellule /doc invite l’Assistant à commenter le code.

Pour obtenir des exemples entièrement illustrés, consultez 5 conseils pour l’Assistant Databricks.

L’Assistant Databricks prend en compte l’historique de la conversation afin que vous puissiez affiner vos questions au fur et à mesure.

Quelle est la tarification appliquée à l’Assistant Databricks ?

Toutes les fonctionnalités actuelles de l’Assistant Databricks sont proposées à l’ensemble des clients sans frais supplémentaires.

Seul le calcul que les utilisateurs utilisent pour exécuter leurs notebooks, requêtes, travaux, etc. est facturé. Des limites d’utilisation équitables sont en place pour éviter les abus. La plupart des utilisateurs ne sont pas affectés par ces limites.

Envoyer des commentaires

La meilleure façon d’envoyer des commentaires consiste à utiliser les liens Fournir des commentaires dans le notebook et l’éditeur SQL. Vous pouvez également envoyer un e-mail à assistant-feedback@databricks.com ou à votre équipe de compte.

Partagez des suggestions d’amélioration du produit et des problèmes d’expérience utilisateur plutôt que des commentaires sur la précision de l’invite. Si vous recevez une suggestion inutile de l'Assistant, cliquez sur le bouton Icône De pouce vers le bas « Pas utile ».

Disponibilité géographique des fonctionnalités de l’Assistant

L’Assistant Databricks est un service désigné qui utilise des zones géographiques pour gérer la résidence des données lors du traitement du contenu de clients. Pour en savoir plus sur la disponibilité des fonctionnalités de l’Assistant dans différentes zones géographiques, consultez Services désignés Databricks.

Confidentialité et sécurité

Q : Quelles données sont envoyées aux modèles ?

L’Assistant Databricks envoie du code et des métadonnées aux modèles sur chaque requête d’API. Cela permet de retourner des résultats plus pertinents pour vos données. Voici quelques exemples :

  • Code/requêtes dans la cellule de notebook active ou l’onglet Éditeur SQL
  • Noms et descriptions des tables et des colonnes
  • Questions précédentes
  • Tables favorites

Q : Les métadonnées envoyées aux modèles respectent-elles les autorisations du catalogue Unity de l’utilisateur ?

Oui, toutes les données envoyées au modèle respectent les autorisations du catalogue Unity de l’utilisateur. Aucune métadonnée relative aux tables pour lesquelles l’utilisateur n’est pas autorisé n’est envoyée.

Q : Si j’exécute une requête avec des résultats, puis que je pose une question, les résultats de ma requête sont-ils envoyés au modèle ?

Non, seul le contenu du code dans les cellules, les métadonnées relatives aux tables et le texte entré par l’utilisateur sont partagés avec le modèle. Pour la fonctionnalité « corriger l’erreur », Databricks partage également l’arborescence des appels de procédure à partir de la sortie de l’erreur.

Q : L’Assistant Databricks exécutera-t-il du code dangereux ?

Non. L’Assistant Databricks n’exécute pas automatiquement le code en votre nom. Les modèles IA peuvent faire des erreurs, mal comprendre l’intention et halluciner ou donner des réponses incorrectes. Passez en revue et testez le code généré par l’IA avant de l’exécuter.

Q : Databricks a-t-il effectué une évaluation pour évaluer la précision et l’adéquation des réponses de l’Assistant ?

Oui. Databricks dispose d’atténuations pour empêcher l’Assistant de générer des réponses dangereuses telles qu’un discours haineux, du code non sécurisé, des jailbreaks d’invite et du contenu de droits d’auteur tiers. Databricks a effectué des tests approfondis de toutes nos fonctionnalités d’assistance IA avec des milliers d’entrées utilisateur simulées pour évaluer la robustesse des atténuations. Ces évaluations se sont concentrées sur les cas d’usage attendus pour l’Assistant, comme la génération de code dans les langages Python, Databricks SQL, R et Scala.

Q : Puis-je utiliser l’Assistant Databricks avec des tables qui traitent des données réglementées (PHI, PCI, IRAP, FedRAMP) ?

Oui. Pour cela, vous devez respecter les exigences, telles que l’activation du profil de sécurité de conformité, et ajouter la norme de conformité appropriée dans le cadre de la configuration du profil de sécurité de conformité.