Partager via


Visualisations dans les notebooks Databricks et dans l’éditeur SQL

Azure Databricks dispose d’outils intégrés puissants pour créer des graphiques et des visualisations directement à partir de vos données lors de l’utilisation de notebooks ou de l’éditeur SQL. Cette page explique comment créer, modifier et gérer des visualisations dans les notebooks et l’éditeur SQL. Pour en savoir plus sur les visualisations pour les tableaux de bord IA/BI, consultez visualisations de tableau de bord.

Pour afficher les types de visualisations que vous pouvez créer à partir de notebooks ou de l’éditeur SQL, consultez les types de visualisation.

Générer un jeu de résultats à visualiser

Pour générer le jeu de résultats utilisé sur cette page, utilisez le code suivant :

SQL

Exécutez la requête suivante dans l’éditeur SQL.

USE CATALOG samples;
   SELECT
      hour(tpep_dropoff_datetime) as dropoff_hour,
      COUNT(*) AS num
   FROM samples.nyctaxi.trips
   WHERE pickup_zip in ['10001', '10002']
   GROUP BY 1;

Python

Exécutez le code suivant à partir d’une cellule Python dans un notebook.

from pyspark.sql.functions import hour, col

pickupzip = '10001'  # Example value for pickupzip
df = spark.table("samples.nyctaxi.trips")
result_df = df.filter(col("pickup_zip") == pickupzip) \
              .groupBy(hour(col("tpep_dropoff_datetime")).alias("dropoff_hour")) \
              .count() \
              .withColumnRenamed("count", "num")
display(result_df)

Créer une visualisation

Vous pouvez créer des visualisations dans la même interface utilisateur que celle où la table des résultats s’affiche. Si vous travaillez dans un notebook, vous pouvez également générer un profil de données, qui fournit des statistiques récapitulatives et des insights visuels pour les DataFrames et les tables. Pour en savoir plus sur les profils de données, consultez Générer un profil de données.

  1. Pour créer une visualisation, cliquez + au-dessus d’un résultat et sélectionnez Visualisation pour ouvrir l’éditeur de visualisation.

    Éditeur SQL

    Tableau des résultats de l’Éditeur SQL avec l’option Visualisation affichée.

    Carnet de notes

    Tableau de résultats du bloc-notes avec l’option Visualisation affichée.

  2. Dans la liste déroulante Type de visualisation, choisissez un type. Sélectionnez ensuite les données à afficher dans la visualisation. Éditeur de visualisation

  3. Après avoir fait des choix de configuration, cliquez sur Enregistrer.

Supprimer, dupliquer ou modifier une visualisation

Pour supprimer, dupliquer ou modifier une visualisation ou un profil de données, cliquez sur la flèche pointant vers le bas à droite du nom de l’onglet. Vous pouvez également créer un tableau de bord à partir du menu.

Remarque

Si la cellule contient un profil de données ou exécute une langue autre que SQL, la visualisation et le profil de données associés ne peuvent être ajoutés qu’à un tableau de bord de notebook. Pour les cellules SQL, vous verrez un élément de menu Ajouter au tableau de bord supplémentaire dans la liste déroulante. Consultez Ajouter une visualisation à un tableau de bord.

Éditeur SQL

Options de menu visualisation dans l’éditeur SQL.

Carnet de notes

Options de menu visualisation dans un bloc-notes.

Vous pouvez également renommer l’onglet en cliquant directement sur le nom et en modifiant le nom en place.

Modifier une visualisation

Pour modifier une visualisation :

  1. Cliquez sur la flèche pointant vers le bas sous l’onglet visualisation. Cliquez ensuite sur Modifier.
  2. Utilisez les onglets de l’éditeur de visualisation pour accéder et modifier différentes parties du graphique.

Filtrer une visualisation

Pour appliquer un filtre sur une visualisation, cliquez sur l’icône Filtrer. Dans le coin supérieur droit, entrez les conditions de filtre à appliquer.

Les filtres appliqués à une visualisation s’appliquent également à la table de résultats. Les filtres appliqués à la table de résultats s’appliquent également à la visualisation.

L’application d’un filtre sur une visualisation filtre également la table des résultats.

Cloner une visualisation

Pour cloner une visualisation, cliquez sur la flèche pointant vers le bas sous l’onglet visualisation. Cliquez ensuite sur Dupliquer.

Activer l’agrégation dans une visualisation

Pour les graphiques à barres, en courbes, en aires, en secteurs et carte thermique, vous ajoutez l’agrégation directement dans la visualisation au lieu de modifier la requête pour ajouter une colonne d’agrégation. Cette approche offre les avantages suivants :

  • Vous n’avez pas besoin de modifier le code qui produit la table de résultats.
  • La modification de l’agrégation vous permet d’effectuer rapidement une analyse des données basée sur des scénarios.
  • L’agrégation s’applique à l’ensemble du jeu de données, pas seulement aux 64 000 premières lignes affichées dans une table.

L’agrégation est disponible dans les visualisations suivantes :

  • Lignes
  • Barres
  • Domaine
  • Secteurs
  • Carte thermique
  • Histogramme

Les agrégations ne prennent pas en charge les visualisations combinées, telles que l’affichage d’une ligne et de barres dans le même graphique.

Pour agréger des colonnes d’axe Y pour une visualisation :

  1. Ouvrez l’éditeur de visualisation en créant un graphique ou en modifiant un graphique existant. Si vous voyez le message This visualization uses an old configuration. New visualizations support aggregating data directly within the editor, vous devez recréer la visualisation avant de pouvoir utiliser l’agrégation.

  2. En regard des colonnes de l’axe Y, sélectionnez le type d’agrégation parmi les suivants pour les types numériques :

    • Sum (valeur par défaut)
    • Moyen
    • Nombre
    • Count Distinct
    • Max
    • Min
    • Médian

    Ou à partir des éléments suivants pour les types chaîne :

    • Nombre
    • Count Distinct
  3. Cliquez sur Enregistrer. La visualisation affiche le nombre de lignes qu’il agrège.

Dans certains cas, vous ne souhaiterez peut-être pas utiliser l’agrégation sur les colonnes de l’axe Y. Pour désactiver l'agrégation, cliquez sur l'icône du menu Kebab à côté des colonnes Y et décochez Utiliser l'agrégation.

Modifier les couleurs de visualisation

Vous pouvez personnaliser les couleurs d’une visualisation lorsque vous créez la visualisation ou en la modifiant.

  1. Créez ou modifiez une visualisation.
  2. Cliquez sur Couleurs.
  3. Pour modifier une couleur, cliquez sur le carré et sélectionnez la nouvelle couleur en procédant de l’une des façons suivantes :
    • Cliquez dessus dans le sélecteur de couleurs.
    • Entrez une valeur hexadécimale.
  4. Cliquez n’importe où en dehors du sélecteur de couleur pour le fermer.
  5. Cliquez sur Enregistrer dans l’éditeur de visualisation pour enregistrer les modifications.

Masquer ou afficher temporairement une série

Pour masquer une série dans une visualisation, cliquez sur la série dans la légende. Pour afficher à nouveau la série, recliquez dans la légende.

Pour afficher une seule série, double-cliquez sur la série dans la légende. Pour afficher d’autres séries, cliquez sur chacune d’elles.

Sélection des séries

Pour sélectionner une série spécifique à analyser sur un graphique, utilisez les commandes suivantes :

  • Cliquez sur un seul élément de légende pour sélectionner cette série
  • Cmd/Ctrl + cliquez sur un élément de légende pour sélectionner ou désélectionner plusieurs séries

Sélection des séries

Info-bulles triées

Utilisez les info-bulles sur les graphiques en courbes et les graphiques à barres non empilées, classées par taille pour faciliter l’analyse.

info-bulles triées

Zoom

Pour les graphiques denses de données, le zoom avant sur des points de données individuels peut être utile pour examiner les détails et rogner les valeurs hors norme. Pour effectuer un zoom avant dans un graphique, cliquez et faites glisser sur le canevas. Pour effacer le zoom, pointez sur le canevas et cliquez sur le bouton Effacer le zoom dans le coin supérieur droit de la visualisation.

zoom avant pour afficher les détails

Télécharger une visualisation en tant que fichier PNG

Pour télécharger une visualisation en tant que fichier PNG, pointez sur le canevas et cliquez sur l’icône de téléchargement dans le coin supérieur droit.

Cliquez sur télécharger pour exporter la visualisation en tant que fichier PNG

Un fichier png est téléchargé sur votre appareil.

Ajouter une visualisation à un tableau de bord

  1. Cliquez sur la flèche pointant vers le bas à droite du nom de l’onglet.
  2. Sélectionnez Ajouter au tableau de bord. Une liste des affichages de tableau de bord disponibles s’affiche, ainsi qu’une option de menu Ajouter au nouveau tableau de bord.
  3. Sélectionnez un tableau de bord ou sélectionnez Ajouter au nouveau tableau de bord. Le tableau de bord s’affiche, y compris la visualisation nouvellement ajoutée.

Visualisations héritées

La dernière version des visualisations de graphique est activée par défaut. Les paramètres de cette section décrivent la visualisation héritée que vous pouvez rencontrer lors de l’utilisation d’un graphique plus ancien ou si la dernière version est désactivée.

Outils de visualisation

Si vous pointez sur le coin supérieur droit d’un graphique dans l’éditeur de visualisation, une barre d’outils Plotly s’affiche dans laquelle vous pouvez effectuer des opérations telles que la sélection, le zoom et le panoramique.

Barre d’outils Plotly

Si vous ne voyez pas la barre d’outils, votre administrateur a désactivé l'affichage de la barre d’outils.

palettes de couleurs personnalisées

Remarque

Par défaut, si un tableau de bord hérité utilise une palette de couleurs personnalisée, les choix de couleurs de visualisation sont ignorés. Pour remplacer ce paramètre, consultez Utiliser une palette de couleur différente pour une visualisation.