Partager via


Types de visualisations de tableau de bord

Cet article décrit les types de visualisations disponibles dans les tableaux de bord IA/BI et vous montre comment créer un exemple de chaque type de visualisation. Pour obtenir des instructions sur la création d’un tableau de bord, consultez Créer un tableau de bord. Vous pouvez utiliser le langage naturel pour inviter l’Assistant à créer des graphiques de barres, de lignes, de points, de nuages de points, de secteurs et de compteurs. Consultez Créer des visualisations avec l’Assistant Databricks.

Remarque

Pour optimiser les performances, les graphiques ne peuvent afficher que 10 000 lignes ou 10 Mo sur le canevas, selon ce qui est plus petit. Sinon, les visualisations peuvent être tronquées.

Visualisation de zone

Les visualisations de zone combinent les visualisations de courbes et de barres pour montrer comment une ou plusieurs valeurs numériques de groupes changent par rapport à la progression d’une deuxième variable, généralement celle du temps. Ils sont souvent utilisés pour afficher les modifications de l’entonnoir de ventes dans le temps.

Pour ajuster la disposition :

  • Cliquez sur l’icône de menu Kebab. Menu kebab dans la section Axe Y du panneau d’édition de visualisation.
  • Dans la section Disposition, choisissez Pile ou 100 % Pile.

Exemple de visualisation de zone

Valeurs de configuration : Pour l’exemple de visualisation de zone fournie, les valeurs suivantes ont été définies :

  • Jeu de données : commandes TPCH
  • Visualisation : zone
  • Titre: Total price and order year by order priority and clerk
  • Axe X :
    • Champ : o_orderdate
    • Type d’échelle : Temporal
    • Transformation : Yearly
    • Titre de l’axe : Order year
  • Axe Y :
    • Champ : o_totalprice
    • Titre de l’axe : Total price
    • Type d’échelle : Quantitative
    • Transformation : Sum
  • Regrouper par :
    • Champ : o_orderpriority
    • Titre de la légende : Order priority
  • Filtre
    • Champ : TPCH orders.o_clerk

Requête SQL : Pour cette visualisation de zone, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH orders.

SELECT * FROM samples.tpch.orders

Graphique à barres

Les graphiques à barres représentent le changement des métriques au fil du temps ou sur différentes catégories et affichent la proportionnalité, comme une visualisation à secteurs.

Exemple de visualisation à barres

Pour ajuster la disposition :

  • Cliquez sur l’icône de menu Kebab. Menu kebab dans la section Axe Y du panneau d’édition de visualisation.
  • Dans la section Disposition, choisissez Pile ou 100 % Pile ou Groupe.

Valeurs de configuration : Pour l’exemple de graphique à barres fourni, les valeurs suivantes ont été définies :

  • Jeu de données : commandes TPCH
  • Visualisation : barre
  • Titre: Total price and order month by order priority and clerk
  • Axe X :
    • Champ : o_orderdate
    • Transformation : Monthly
    • Type d’échelle : Temporal
    • Titre de l’axe : Order month
  • Axe Y :
    • Champ : o_totalprice
    • Type d’échelle : Quantitative
    • Transformation : Sum
    • Titre de l’axe : Total price
  • Regrouper par :
    • Champ : o_orderpriority
    • Titre de la légende : Order priority
  • Filtre
    • Champ : TPCH orders.o_clerk

Requête SQL : la requête SQL suivante a généré le jeu TPCH orders de données pour cette visualisation de barre.

SELECT * FROM samples.tpch.orders

Graphique en boîte

La visualisation de graphique en boîte montre la synthèse de la distribution de données numériques, éventuellement regroupées par catégorie. À l’aide d’une visualisation de graphique en rectangles, vous pouvez rapidement comparer les plages de valeurs entre les catégories et visualiser les groupes de localisation, d’écart et d’asymétrie des valeurs par le biais de leurs quartiles. Dans chaque boîte, la ligne plus foncée indique l’écart interquartile. Pour plus d’informations sur l’interprétation des visualisations de graphique en boîte, consultez l’article Graphique en boîte sur Wikipédia.

Exemple de graphique en boîte

Pour l’exemple de graphique de zone fourni, les valeurs suivantes ont été définies :

  • Colonne X (colonne de jeu de données) : l-returnflag
  • Colonnes Y (colonne de jeu de données) : l_extendedprice
  • Titre de l’axe X : Return flag1
  • Titre de l’axe Y : Extended price

Requête SQL : pour cette visualisation de graphique en zone, la requête SQL suivante a été utilisée pour générer le jeu de données.

select * from samples.tpch.lineitem

Graphique en bulles

Les graphiques en bulles sont des graphiques de dispersion où la taille de chaque bulle reflète une métrique pertinente. Pour créer un graphique en bulles, sélectionnez Nuages de points comme type de visualisation. Dans le paramètre Taille , sélectionnez la métrique que vous souhaitez représenter par la taille des marqueurs.

Exemple de visualisation de graphique en bulles

Valeurs de configuration : Pour l’exemple de graphique en bulles fourni, les valeurs suivantes ont été définies :

  • Jeu de données : courses de taxi à NYC
  • Visualisation : nuage de points
  • Titre: Trip distance, fares, and trip duration
  • Axe X :
    • Champ : trip_distance
    • Type d’échelle : Quantitative
    • Transformation : None
  • Axe Y :
    • Champ : fare_amount
    • Type d’échelle : Quantitative
    • Transformation : None
  • Colorer selon :
    • Champ : pickup_zip
  • Taille:
    • Champ : time_spent
    • Transformation : None

Carte choroplèthe

Dans les visualisations choropleth, les localités géographiques, telles que les pays ou les états, sont colorées en fonction des valeurs agrégées de chaque colonne clé. La requête doit retourner des emplacements géographiques par nom. Les utilisateurs peuvent créer des cartes qui affichent des limites administratives au niveau du pays, de l’état ou de la province, du comté ou du district.

Exemple de carte Choropleth

Valeurs de configuration : pour cette visualisation choropleth, les valeurs suivantes ont été définies :

  • Jeu de données: tcph nation
  • Pays: Country
  • Couleur : sum(c_acct_bal)

Requête SQL : pour cette visualisation choropleth, la requête SQL suivante a été utilisée pour générer le jeu de données.

SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1

Graphique combiné

Les graphiques combinés combinent des graphiques en courbes et en barres pour présenter les modifications au fil du temps avec la proportionnelle.

Exemple de graphique combiné

Valeurs de configuration : Pour cette visualisation de graphique combiné, les valeurs suivantes ont été définies :

  • Jeu de données : partsupp
  • Visualisation : combo
  • Axe X : ps_partkey
    • Type d’échelle : Quantitative
  • Axe Y :
    • Barre : ps_availqty
    • Type d’agrégation : SUM
    • Ligne : ps_supplycost
    • Type d’agrégation : AVG
  • Couleur par Série Y :
    • Sum of ps_availqty
    • Average ps_supplycost

Requête SQL : pour cette visualisation de graphique combiné, la requête SQL suivante a été utilisée pour générer le jeu de données.

SELECT * FROM samples.tpch.partsupp

Graphique combiné à double axe

Vous pouvez utiliser des graphiques combinés pour afficher deux axes y différents. Une fois le widget de graphique combiné sélectionné, cliquez sur l’icône de menu Kebab. Menu kebab dans les paramètres de l’axe Y dans le panneau de configuration du graphique. Activez l’option Activer l’axe double.

Exemple de graphique combiné double axe

Valeurs de configuration : pour ce graphique combiné, l’option Activer l’axe double est activée. Les autres configurations sont définies comme suit :

  • Jeu de données : Voyages
  • Visualisation : combo
  • Axe X : tpep_pickup_datetime
    • Type d’échelle : Temporal
    • Transformation : Weekly
  • Axe Y :
    • Axe Y gauche (Barre) : trip_distance
      • Transformation : AVG
    • Axe Y droit (Ligne) : fare_amount
      • Transformation : AVG

Couleur par série Y :

  • Average trip_distance
    • Average fare_amount

Requête SQL : La requête SQL suivante a été utilisée pour générer le jeu de données :

SELECT * FROM samples.nyctaxi.trips

Visualisation de compteur

Les compteurs affichent une valeur unique en évidence, avec une option pour les comparer à une valeur cible. Pour utiliser des compteurs, spécifiez les données à afficher sur la visualisation des compteurs pour les colonnes Valeur et Cible . Si vous appliquez des agrégations dans l’éditeur de visualisation, vous ne pouvez pas comparer les valeurs en sélectionnant un numéro de ligne Valeur, comme dans l’exemple suivant. Pour comparer des valeurs de ligne spécifiques, utilisez un jeu de données qui inclut toutes les agrégations requises dans le sql qui le définit. Cela vous permet de sélectionner des lignes cibles et de valeurs pour la comparaison.

Exemple de compteur

Vous pouvez définir la mise en forme conditionnelle et personnaliser le style de texte dans les détails de configuration valeur .

Options de mise en forme conditionnelle pour le graphique de compteurs affiché.

Valeurs de configuration : Pour cet exemple de visualisation de compteur, les valeurs suivantes ont été définies :

  • Jeu de données : Contre-exemple
  • Visualisation : compteur
  • Titre: Orders: Total price by date (previous two days)
  • Valeur :
    • Champ : total price
    • Numéro de ligne de valeur : 1
  • Cible:
    • Champ : total price
    • Numéro de ligne de valeur : 2

Requête SQL : Pour cette visualisation de compteur, la requête SQL suivante a été utilisée pour générer le jeu de données :

SELECT
  SUM(o_totalprice) as `total price`,
  o_orderdate
FROM
  samples.tpch.orders
GROUP BY o_orderdate
ORDER BY o_orderdate DESC

Visualisation de ligne

Les visualisations en courbes présentent le changement dans une ou plusieurs métriques au fil du temps.

Exemple de visualisation de ligne

Valeurs de configuration : Pour cet exemple de visualisation de ligne, les valeurs suivantes ont été définies :

  • Jeu de données : commandes TPCH
  • Visualisation : ligne
  • Titre: Average price and order year by order priority and clerk
  • Axe X :
    • Champ : o_orderdate
    • Transformation : Yearly
    • Type d’échelle : Temporal
    • Titre de l’axe : Order year
  • Axe Y :
    • Champ : o_totalprice
    • Transformation : Average
    • Type d’échelle : Quantitative
    • Titre de l’axe : Average price
  • Regrouper par :
    • Champ : o_orderpriority
    • Titre de la légende : Order priority
  • Filtre
    • Champ : TPCH orders.o_clerk

Requête SQL : Pour cette visualisation de visualisation à barres, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH orders.

SELECT * FROM samples.tpch.orders

Graphique de carte thermique

Les graphiques de carte thermique combinent des fonctionnalités de graphiques à barres, d’empilement et de graphiques en bulles, ce qui vous permet de visualiser des données numériques à l’aide de couleurs. Une palette de couleurs commune pour un carte thermique affiche les valeurs les plus élevées à l’aide de couleurs plus chaudes, telles que l’orange ou le rouge, et les valeurs les plus basses à l’aide de couleurs plus fraîches, comme le bleu ou le violet.

Par exemple, la carte thermique suivante visualise les distances les plus fréquentes des courses de taxi chaque jour et regroupe les résultats par jour de la semaine, de la distance et du prix total.

Remarque

Les cartes thermiques peuvent afficher jusqu’à 64 000 lignes ou 10 Mo.

Exemple de carte thermique

Valeurs de configuration : Pour cette visualisation de graphique de carte thermique, les valeurs suivantes ont été définies :

  • Jeu de données : commandes TPCH
  • Visualisation : Carte thermique
  • Colonne X (colonne de jeu de données) : o_orderpriority
  • Colonnes Y (colonne de jeu de données) : o_orderstatus
  • Colonne couleur :
    • Colonne de jeu de données : o_totalprice
    • Type d’agrégation : Average
  • Nom de l’axe X (remplacer la valeur par défaut) : Order priority
  • Nom de l’axe Y(remplacer la valeur par défaut) : Order status
  • Jeu de couleurs (remplacer la valeur par défaut) : YIGnBu

Requête SQL : pour cette visualisation de graphique de carte thermique, la requête SQL suivante a été utilisée pour générer le jeu de données.

SELECT * FROM samples.tpch.orders

Histogramme

Un histogramme trace la fréquence à laquelle une valeur donnée se produit dans un jeu de données. Un histogramme vous permet de comprendre si un jeu de données a des valeurs qui sont regroupées autour d’un petit nombre de plages ou sont plus réparties. Un histogramme s’affiche sous la forme d’un graphique à barres dans lequel vous contrôlez le nombre de barres distinctes (également appelées bacs).

Exemple de graphique histogramme

Valeurs de configuration : Pour cette visualisation de graphique histogramme, les valeurs suivantes ont été définies :

  • Jeu de données : commandes TPCH
  • Visualisation : Histogramme
  • Colonne X (colonne de jeu de données) : o_totalprice
  • Nombre de compartiments : 20
  • Nom de l’axe X (remplacer la valeur par défaut) : Total price

Options de configuration : pour les options de configuration du graphique histogramme, consultez les options de configuration du graphique histogramme.

Requête SQL : pour cette visualisation de graphique histogramme, la requête SQL suivante a été utilisée pour générer le jeu de données.

select * from samples.tpch.orders

Visualisation de secteurs

Les graphiques circulaires montrent la proportionnalité entre les métriques. Ils ne sont pas destinés à transmettre des données de série chronologique.

Exemple de visualisation de secteurs

Valeurs de configuration : pour cet exemple de visualisation en secteurs, les valeurs suivantes ont été définies :

  • Jeu de données : commandes TPCH
  • Visualisation : visualisation à secteurs
  • Titre: Total price by order priority and clerk
  • Angle:
    • Champ : o_totalprice
    • Transformation : Sum
    • Titre de l’axe : Total price
  • Regrouper par :
    • Champ : o_orderpriority
    • Titre de la légende : Order priority
  • Filtre
    • Champ : TPCH orders.o_clerk

Requête SQL : pour ce diagramme circulaire, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH orders.

SELECT * FROM samples.tpch.orders

Visualisation de tableau croisé dynamique

La visualisation de tableau croisé dynamique agrège les enregistrements d’un résultat de requête dans un affichage tabulaire. C’est similaire aux instructions PIVOT ou GROUP BY dans SQL. Vous configurez la visualisation de tableau croisé dynamique avec des champs de type glisser-déplacer.

Remarque

Pour des raisons de performances, les tableaux croisés dynamiques prennent uniquement en charge le rendu de 100 colonnes x 100 lignes.

Exemple de pivot

Valeurs de configuration : Pour cet exemple de visualisation de tableau croisé dynamique, les valeurs suivantes ont été définies :

  • Jeu de données : TPCH lineitem
  • Visualisation : tableau croisé dynamique
  • Titre: Line item quantity by return flag and ship mode by supplier
  • Lignes:
    • Champ : l_returnflag
  • Colonnes:
    • Champ : l_shipmode
  • Cellule
    • Jeu de données:
    • Champ : l_quantity
    • Transformation : somme
  • Filtre
    • Champ : TPCH lineitem.l_supplierkey

Requête SQL : pour cette visualisation de tableau croisé dynamique, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH lineitem.

SELECT * FROM samples.tpch.lineitem

Carte de points

Les cartes de points affichent des données quantitatives sous forme de symboles placés à des emplacements de carte spécifiques. Les marqueurs sont positionnés à l’aide des coordonnées de latitude et de longitude, qui doivent être incluses dans le jeu de résultats pour ce type de graphique. L’exemple suivant utilise des données provenant de collisions de véhicules automobiles à New York, NY.

Exemple de carte de point

Valeurs de configuration : Pour cette visualisation de carte de points, les valeurs suivantes ont été définies :

  • Jeu de données : Seattle House Prices Analysis
  • Visualisation : carte de points
  • Coordonnées:
    • Latitude : LATITUDE
    • Longitude : LONGITUDE
  • Couleur:
    • Champ : avg(bedrooms)
      • Type d’échelle : catégorie
  • Taille:
    • Champ : avg(price)

Remarque

Aucun jeu de données Databricks n’inclut de données de latitude ou de longitude. Par conséquent, un exemple de requête SQL n’est pas fourni pour cet exemple.

Diagramme Sankey

Un diagramme sankey visualise le flux d’un ensemble de valeurs à un autre.

Exemple Sankey

Valeurs de configuration : pour ce diagramme sankey, les valeurs suivantes ont été définies :

  • Jeu de données : Exemple Sankey
  • Visualisation : Sankey
  • Étapes
    • stage1
    • stage2
  • Valeur
    • SOMME(valeur)

Requête SQL : pour cette visualisation Sankey, la requête SQL suivante a été utilisée pour générer le jeu de données.

SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10

Visualisation de nuage de points

Les visualisations de nuages de points sont couramment utilisées pour afficher la relation entre deux variables numériques. Vous pouvez encoder la troisième dimension avec des couleurs pour montrer comment les variables numériques diffèrent entre les groupes.

Exemple de nuage de points

Valeurs de configuration : Pour cet exemple de visualisation de nuages de points, les valeurs suivantes ont été définies :

  • Jeu de données : TPCH lineitem
  • Visualisation : nuage de points
  • Titre: Total price and quantity by ship mode and supplier
  • Axe X :
    • Champ : l_quantity
    • Titre de l’axe : Quantity
    • Type d’échelle : Quantitative
    • Transformation : None
  • Axe Y :
    • Champ : l_extendedprice
    • Type d’échelle : Quantitative
    • Transformation : None
    • Titre de l’axe : Price
  • Regrouper par :
    • Champ : l_shipmode
    • Titre de la légende : Ship mode
  • Filtre
    • Champ : TPCH lineitem.l_supplierkey

Requête SQL : pour cette visualisation de nuages de points, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH lineitem.

SELECT * FROM samples.tpch.lineitem

Visualisation de table

La visualisation de table affiche les données d’une table standard, mais vous permet de réorganiser, masquer et mettre en forme manuellement les données.

Remarque

Les tableaux peuvent afficher jusqu’à 64 000 lignes ou 10 Mo.

Exemple de tableau

Valeurs de configuration : Pour cet exemple de visualisation de table, les valeurs suivantes ont été définies :

  • Jeu de données : TPCH lineitem
  • Visualisation : Table
  • Titre: Line item summary by supplier
  • Colonnes:
    • Afficher le numéro de ligne : Activé
    • Champ : l_orderkey
    • Champ : l_extendedprice
      • Afficher comme : Number
      • Format des nombres : 0,00 $
    • Champ : l_discount
      • Afficher comme : Number
      • Format des nombres : %0,00
    • Champ : l_tax
      • Afficher comme : Number
      • Format des nombres : %0,00
    • Champ : l_shipdate
    • Champ : l_shipmode
  • Filtre
    • Champ : TPCH lineitem.l_supplierkey

Options de configuration : pour les options de configuration de visualisation de table, consultez options de table.

Requête SQL : pour cette visualisation de table, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH lineitem.

SELECT * FROM samples.tpch.lineitem