Notes
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cet article décrit les types de visualisations disponibles dans les tableaux de bord IA/BI et vous montre comment créer un exemple de chaque type de visualisation. Pour obtenir des instructions sur la création d’un tableau de bord, consultez Créer un tableau de bord. Vous pouvez utiliser le langage naturel pour inviter l’Assistant à créer des graphiques de barres, de lignes, de points, de nuages de points, de secteurs et de compteurs. Consultez Créer des visualisations avec l’Assistant Databricks.
Remarque
Pour optimiser les performances, les graphiques ne peuvent afficher que 10 000 lignes ou 10 Mo sur le canevas, selon ce qui est plus petit. Sinon, les visualisations peuvent être tronquées.
Visualisation de zone
Les visualisations de zone combinent les visualisations de courbes et de barres pour montrer comment une ou plusieurs valeurs numériques de groupes changent par rapport à la progression d’une deuxième variable, généralement celle du temps. Ils sont souvent utilisés pour afficher les modifications de l’entonnoir de ventes dans le temps.
Pour ajuster la disposition :
- Cliquez sur
dans la section Axe Y du panneau d’édition de visualisation.
- Dans la section Disposition, choisissez Pile ou 100 % Pile.
Valeurs de configuration : Pour l’exemple de visualisation de zone fournie, les valeurs suivantes ont été définies :
- Jeu de données : commandes TPCH
- Visualisation : zone
- Titre:
Total price and order year by order priority and clerk
- Axe X :
- Champ :
o_orderdate
- Type d’échelle :
Temporal
- Transformation :
Yearly
- Titre de l’axe :
Order year
- Champ :
- Axe Y :
- Champ :
o_totalprice
- Titre de l’axe :
Total price
- Type d’échelle :
Quantitative
- Transformation :
Sum
- Champ :
- Regrouper par :
- Champ :
o_orderpriority
- Titre de la légende :
Order priority
- Champ :
- Filtre
- Champ :
TPCH orders.o_clerk
- Champ :
Requête SQL : Pour cette visualisation de zone, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH orders
.
SELECT * FROM samples.tpch.orders
Graphique à barres
Les graphiques à barres représentent le changement des métriques au fil du temps ou sur différentes catégories et affichent la proportionnalité, comme une visualisation à secteurs.
Pour ajuster la disposition :
- Cliquez sur
dans la section Axe Y du panneau d’édition de visualisation.
- Dans la section Disposition, choisissez Pile ou 100 % Pile ou Groupe.
Valeurs de configuration : Pour l’exemple de graphique à barres fourni, les valeurs suivantes ont été définies :
- Jeu de données : commandes TPCH
- Visualisation : barre
- Titre:
Total price and order month by order priority and clerk
- Axe X :
- Champ :
o_orderdate
- Transformation :
Monthly
- Type d’échelle :
Temporal
- Titre de l’axe :
Order month
- Champ :
- Axe Y :
- Champ :
o_totalprice
- Type d’échelle :
Quantitative
- Transformation :
Sum
- Titre de l’axe :
Total price
- Champ :
- Regrouper par :
- Champ :
o_orderpriority
- Titre de la légende :
Order priority
- Champ :
- Filtre
- Champ :
TPCH orders.o_clerk
- Champ :
Requête SQL : la requête SQL suivante a généré le jeu TPCH orders
de données pour cette visualisation de barre.
SELECT * FROM samples.tpch.orders
Graphique en boîte
La visualisation de graphique en boîte montre la synthèse de la distribution de données numériques, éventuellement regroupées par catégorie. À l’aide d’une visualisation de graphique en rectangles, vous pouvez rapidement comparer les plages de valeurs entre les catégories et visualiser les groupes de localisation, d’écart et d’asymétrie des valeurs par le biais de leurs quartiles. Dans chaque boîte, la ligne plus foncée indique l’écart interquartile. Pour plus d’informations sur l’interprétation des visualisations de graphique en boîte, consultez l’article Graphique en boîte sur Wikipédia.
Pour l’exemple de graphique de zone fourni, les valeurs suivantes ont été définies :
- Colonne X (colonne de jeu de données) :
l-returnflag
- Colonnes Y (colonne de jeu de données) :
l_extendedprice
- Titre de l’axe X :
Return flag1
- Titre de l’axe Y :
Extended price
Requête SQL : pour cette visualisation de graphique en zone, la requête SQL suivante a été utilisée pour générer le jeu de données.
select * from samples.tpch.lineitem
Graphique en bulles
Les graphiques en bulles sont des graphiques de dispersion où la taille de chaque bulle reflète une métrique pertinente. Pour créer un graphique en bulles, sélectionnez Nuages de points comme type de visualisation. Dans le paramètre Taille , sélectionnez la métrique que vous souhaitez représenter par la taille des marqueurs.
Valeurs de configuration : Pour l’exemple de graphique en bulles fourni, les valeurs suivantes ont été définies :
- Jeu de données : courses de taxi à NYC
- Visualisation : nuage de points
- Titre:
Trip distance, fares, and trip duration
- Axe X :
- Champ :
trip_distance
- Type d’échelle :
Quantitative
- Transformation :
None
- Champ :
- Axe Y :
- Champ :
fare_amount
- Type d’échelle :
Quantitative
- Transformation :
None
- Champ :
- Colorer selon :
- Champ :
pickup_zip
- Champ :
- Taille:
- Champ :
time_spent
- Transformation :
None
- Champ :
Carte choroplèthe
Dans les visualisations choropleth, les localités géographiques, telles que les pays ou les états, sont colorées en fonction des valeurs agrégées de chaque colonne clé. La requête doit retourner des emplacements géographiques par nom. Les utilisateurs peuvent créer des cartes qui affichent des limites administratives au niveau du pays, de l’état ou de la province, du comté ou du district.
Valeurs de configuration : pour cette visualisation choropleth, les valeurs suivantes ont été définies :
- Jeu de données:
tcph nation
- Pays:
Country
- Couleur : sum(c_acct_bal)
Requête SQL : pour cette visualisation choropleth, la requête SQL suivante a été utilisée pour générer le jeu de données.
SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1
Graphique combiné
Les graphiques combinés combinent des graphiques en courbes et en barres pour présenter les modifications au fil du temps avec la proportionnelle.
Valeurs de configuration : Pour cette visualisation de graphique combiné, les valeurs suivantes ont été définies :
- Jeu de données : partsupp
- Visualisation : combo
- Axe X :
ps_partkey
- Type d’échelle :
Quantitative
- Type d’échelle :
- Axe Y :
- Barre :
ps_availqty
- Type d’agrégation :
SUM
- Ligne :
ps_supplycost
- Type d’agrégation :
AVG
- Barre :
- Couleur par Série Y :
Sum of ps_availqty
Average ps_supplycost
Requête SQL : pour cette visualisation de graphique combiné, la requête SQL suivante a été utilisée pour générer le jeu de données.
SELECT * FROM samples.tpch.partsupp
Graphique combiné à double axe
Vous pouvez utiliser des graphiques combinés pour afficher deux axes y différents. Une fois le widget de graphique combiné sélectionné, cliquez sur Menu kebab dans les paramètres de l’axe Y dans le panneau de configuration du graphique. Activez l’option Activer l’axe double.
Valeurs de configuration : pour ce graphique combiné, l’option Activer l’axe double est activée. Les autres configurations sont définies comme suit :
- Jeu de données : Voyages
- Visualisation : combo
- Axe X :
tpep_pickup_datetime
- Type d’échelle :
Temporal
- Transformation :
Weekly
- Type d’échelle :
- Axe Y :
- Axe Y gauche (Barre) :
trip_distance
- Transformation :
AVG
- Transformation :
- Axe Y droit (Ligne) :
fare_amount
- Transformation :
AVG
- Transformation :
- Axe Y gauche (Barre) :
Couleur par série Y :
Average trip_distance
Average fare_amount
Requête SQL : La requête SQL suivante a été utilisée pour générer le jeu de données :
SELECT * FROM samples.nyctaxi.trips
Visualisation de compteur
Les compteurs affichent une valeur unique en évidence, avec une option pour les comparer à une valeur cible. Pour utiliser des compteurs, spécifiez les données à afficher sur la visualisation des compteurs pour les colonnes Valeur et Cible . Si vous appliquez des agrégations dans l’éditeur de visualisation, vous ne pouvez pas comparer les valeurs en sélectionnant un numéro de ligne Valeur, comme dans l’exemple suivant. Pour comparer des valeurs de ligne spécifiques, utilisez un jeu de données qui inclut toutes les agrégations requises dans le sql qui le définit. Cela vous permet de sélectionner des lignes cibles et de valeurs pour la comparaison.
Vous pouvez définir la mise en forme conditionnelle et personnaliser le style de texte dans les détails de configuration valeur .
Valeurs de configuration : Pour cet exemple de visualisation de compteur, les valeurs suivantes ont été définies :
- Jeu de données : Contre-exemple
- Visualisation : compteur
- Titre:
Orders: Total price by date (previous two days)
- Valeur :
- Champ :
total price
- Numéro de ligne de valeur : 1
- Champ :
- Cible:
- Champ :
total price
- Numéro de ligne de valeur : 2
- Champ :
Requête SQL : Pour cette visualisation de compteur, la requête SQL suivante a été utilisée pour générer le jeu de données :
SELECT
SUM(o_totalprice) as `total price`,
o_orderdate
FROM
samples.tpch.orders
GROUP BY o_orderdate
ORDER BY o_orderdate DESC
Visualisation de ligne
Les visualisations en courbes présentent le changement dans une ou plusieurs métriques au fil du temps.
Valeurs de configuration : Pour cet exemple de visualisation de ligne, les valeurs suivantes ont été définies :
- Jeu de données : commandes TPCH
- Visualisation : ligne
- Titre:
Average price and order year by order priority and clerk
- Axe X :
- Champ :
o_orderdate
- Transformation :
Yearly
- Type d’échelle :
Temporal
- Titre de l’axe :
Order year
- Champ :
- Axe Y :
- Champ :
o_totalprice
- Transformation :
Average
- Type d’échelle :
Quantitative
- Titre de l’axe :
Average price
- Champ :
- Regrouper par :
- Champ :
o_orderpriority
- Titre de la légende :
Order priority
- Champ :
- Filtre
- Champ :
TPCH orders.o_clerk
- Champ :
Requête SQL : Pour cette visualisation de visualisation à barres, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH orders
.
SELECT * FROM samples.tpch.orders
Graphique de carte thermique
Les graphiques de carte thermique combinent des fonctionnalités de graphiques à barres, d’empilement et de graphiques en bulles, ce qui vous permet de visualiser des données numériques à l’aide de couleurs. Une palette de couleurs commune pour un carte thermique affiche les valeurs les plus élevées à l’aide de couleurs plus chaudes, telles que l’orange ou le rouge, et les valeurs les plus basses à l’aide de couleurs plus fraîches, comme le bleu ou le violet.
Par exemple, la carte thermique suivante visualise les distances les plus fréquentes des courses de taxi chaque jour et regroupe les résultats par jour de la semaine, de la distance et du prix total.
Remarque
Les cartes thermiques peuvent afficher jusqu’à 64 000 lignes ou 10 Mo.
Valeurs de configuration : Pour cette visualisation de graphique de carte thermique, les valeurs suivantes ont été définies :
- Jeu de données : commandes TPCH
- Visualisation : Carte thermique
- Colonne X (colonne de jeu de données) :
o_orderpriority
- Colonnes Y (colonne de jeu de données) :
o_orderstatus
- Colonne couleur :
- Colonne de jeu de données :
o_totalprice
- Type d’agrégation :
Average
- Colonne de jeu de données :
- Nom de l’axe X (remplacer la valeur par défaut) :
Order priority
- Nom de l’axe Y(remplacer la valeur par défaut) :
Order status
- Jeu de couleurs (remplacer la valeur par défaut) :
YIGnBu
Requête SQL : pour cette visualisation de graphique de carte thermique, la requête SQL suivante a été utilisée pour générer le jeu de données.
SELECT * FROM samples.tpch.orders
Histogramme
Un histogramme trace la fréquence à laquelle une valeur donnée se produit dans un jeu de données. Un histogramme vous permet de comprendre si un jeu de données a des valeurs qui sont regroupées autour d’un petit nombre de plages ou sont plus réparties. Un histogramme s’affiche sous la forme d’un graphique à barres dans lequel vous contrôlez le nombre de barres distinctes (également appelées bacs).
Valeurs de configuration : Pour cette visualisation de graphique histogramme, les valeurs suivantes ont été définies :
- Jeu de données : commandes TPCH
- Visualisation : Histogramme
- Colonne X (colonne de jeu de données) :
o_totalprice
- Nombre de compartiments : 20
- Nom de l’axe X (remplacer la valeur par défaut) :
Total price
Options de configuration : pour les options de configuration du graphique histogramme, consultez les options de configuration du graphique histogramme.
Requête SQL : pour cette visualisation de graphique histogramme, la requête SQL suivante a été utilisée pour générer le jeu de données.
select * from samples.tpch.orders
Visualisation de secteurs
Les graphiques circulaires montrent la proportionnalité entre les métriques. Ils ne sont pas destinés à transmettre des données de série chronologique.
Valeurs de configuration : pour cet exemple de visualisation en secteurs, les valeurs suivantes ont été définies :
- Jeu de données : commandes TPCH
- Visualisation : visualisation à secteurs
- Titre:
Total price by order priority and clerk
- Angle:
- Champ :
o_totalprice
- Transformation :
Sum
- Titre de l’axe :
Total price
- Champ :
- Regrouper par :
- Champ :
o_orderpriority
- Titre de la légende :
Order priority
- Champ :
- Filtre
- Champ :
TPCH orders.o_clerk
- Champ :
Requête SQL : pour ce diagramme circulaire, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH orders
.
SELECT * FROM samples.tpch.orders
Visualisation de tableau croisé dynamique
La visualisation de tableau croisé dynamique agrège les enregistrements d’un résultat de requête dans un affichage tabulaire. C’est similaire aux instructions PIVOT
ou GROUP BY
dans SQL. Vous configurez la visualisation de tableau croisé dynamique avec des champs de type glisser-déplacer.
Remarque
Pour des raisons de performances, les tableaux croisés dynamiques prennent uniquement en charge le rendu de 100 colonnes x 100 lignes.
Valeurs de configuration : Pour cet exemple de visualisation de tableau croisé dynamique, les valeurs suivantes ont été définies :
- Jeu de données : TPCH lineitem
- Visualisation : tableau croisé dynamique
- Titre:
Line item quantity by return flag and ship mode by supplier
- Lignes:
- Champ :
l_returnflag
- Champ :
- Colonnes:
- Champ :
l_shipmode
- Champ :
- Cellule
- Jeu de données:
- Champ :
l_quantity
- Transformation : somme
- Filtre
- Champ :
TPCH lineitem.l_supplierkey
- Champ :
Requête SQL : pour cette visualisation de tableau croisé dynamique, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH lineitem
.
SELECT * FROM samples.tpch.lineitem
Carte de points
Les cartes de points affichent des données quantitatives sous forme de symboles placés à des emplacements de carte spécifiques. Les marqueurs sont positionnés à l’aide des coordonnées de latitude et de longitude, qui doivent être incluses dans le jeu de résultats pour ce type de graphique. L’exemple suivant utilise des données provenant de collisions de véhicules automobiles à New York, NY.
Valeurs de configuration : Pour cette visualisation de carte de points, les valeurs suivantes ont été définies :
- Jeu de données : Seattle House Prices Analysis
- Visualisation : carte de points
- Coordonnées:
- Latitude :
LATITUDE
- Longitude :
LONGITUDE
- Latitude :
- Couleur:
- Champ :
avg(bedrooms)
- Type d’échelle : catégorie
- Champ :
- Taille:
- Champ :
avg(price)
- Champ :
Remarque
Aucun jeu de données Databricks n’inclut de données de latitude ou de longitude. Par conséquent, un exemple de requête SQL n’est pas fourni pour cet exemple.
Diagramme Sankey
Un diagramme sankey visualise le flux d’un ensemble de valeurs à un autre.
Valeurs de configuration : pour ce diagramme sankey, les valeurs suivantes ont été définies :
- Jeu de données : Exemple Sankey
- Visualisation : Sankey
- Étapes
stage1
stage2
- Valeur
- SOMME(valeur)
Requête SQL : pour cette visualisation Sankey, la requête SQL suivante a été utilisée pour générer le jeu de données.
SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10
Visualisation de nuage de points
Les visualisations de nuages de points sont couramment utilisées pour afficher la relation entre deux variables numériques. Vous pouvez encoder la troisième dimension avec des couleurs pour montrer comment les variables numériques diffèrent entre les groupes.
Valeurs de configuration : Pour cet exemple de visualisation de nuages de points, les valeurs suivantes ont été définies :
- Jeu de données : TPCH lineitem
- Visualisation : nuage de points
- Titre:
Total price and quantity by ship mode and supplier
- Axe X :
- Champ :
l_quantity
- Titre de l’axe :
Quantity
- Type d’échelle :
Quantitative
- Transformation :
None
- Champ :
- Axe Y :
- Champ :
l_extendedprice
- Type d’échelle :
Quantitative
- Transformation :
None
- Titre de l’axe :
Price
- Champ :
- Regrouper par :
- Champ :
l_shipmode
- Titre de la légende :
Ship mode
- Champ :
- Filtre
- Champ :
TPCH lineitem.l_supplierkey
- Champ :
Requête SQL : pour cette visualisation de nuages de points, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH lineitem
.
SELECT * FROM samples.tpch.lineitem
Visualisation de table
La visualisation de table affiche les données d’une table standard, mais vous permet de réorganiser, masquer et mettre en forme manuellement les données.
Remarque
Les tableaux peuvent afficher jusqu’à 64 000 lignes ou 10 Mo.
Valeurs de configuration : Pour cet exemple de visualisation de table, les valeurs suivantes ont été définies :
- Jeu de données : TPCH lineitem
- Visualisation : Table
- Titre:
Line item summary by supplier
- Colonnes:
- Afficher le numéro de ligne : Activé
- Champ :
l_orderkey
- Champ :
l_extendedprice
- Afficher comme :
Number
- Format des nombres : 0,00 $
- Afficher comme :
- Champ :
l_discount
- Afficher comme :
Number
- Format des nombres : %0,00
- Afficher comme :
- Champ :
l_tax
- Afficher comme :
Number
- Format des nombres : %0,00
- Afficher comme :
- Champ :
l_shipdate
- Champ :
l_shipmode
- Filtre
- Champ :
TPCH lineitem.l_supplierkey
- Champ :
Options de configuration : pour les options de configuration de visualisation de table, consultez options de table.
Requête SQL : pour cette visualisation de table, la requête SQL suivante a été utilisée pour générer le jeu de données nommé TPCH lineitem
.
SELECT * FROM samples.tpch.lineitem