Visualisations dans les notebooks Databricks
Azure Databricks offre une prise en charge intégrée des graphiques et des visualisations dans Databricks SQL et dans les notebooks. Cette page explique comment utiliser des visualisations dans un notebook Databricks. Pour plus d’informations sur l’utilisation des visualisations dans Databricks SQL, consultez Visualisation dans Databricks SQL.
Pour afficher les types de visualisations, consultez Types de visualisation.
Important
Pour plus d’informations sur une préversion des graphiques Azure Databricks, veuillez consulter Visualisations de graphiques en préversion.
Créer une visualisation
Pour recréer l’exemple de cette section, utilisez le code suivant :
sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)
Pour créer une visualisation, cliquez sur + au-dessus d’un résultat et sélectionnez Visualisation. L’éditeur de visualisation s’affiche.
Dans la liste déroulante Type de visualisation, choisissez un type.
Sélectionnez les données à afficher dans la visualisation. Les champs disponibles dépendent du type sélectionné.
Cliquez sur Enregistrer.
Outils de visualisation
Si vous survolez la partie supérieure droite d’un graphique dans l’éditeur de visualisation, une barre d’outils Plotly s’affiche et vous permet d’effectuer des opérations telles que la sélection, le zoom et le panoramique.
Si vous pointez en haut à droite d’un graphique en dehors de l’éditeur de visualisation, un sous-ensemble d’outils plus petit s’affiche :
Créer un profil de données
Remarque
Disponible dans Databricks Runtime 9.1 LTS et ultérieur.
Les profils de données affichent une synthèse des statistiques d’un DataFrame Apache Spark, d’un DataFrame pandas ou d’une table SQL au format tabulaire et graphique. Pour créer un profil de données à partir d’une cellule de résultats, cliquez sur + et sélectionnez Profil de données.
Azure Databricks calcule et affiche la synthèse des statistiques.
- Les fonctionnalités numériques et de catégorie sont indiquées dans des tables distinctes.
- En haut de l’onglet, vous pouvez trier ou rechercher des fonctionnalités.
- En haut de la colonne de graphique, vous pouvez choisir d’afficher un histogramme (standard) ou des quantiles.
- Cochez développer pour agrandir les graphiques.
- Cochez log pour afficher les graphiques sur une échelle logarithmique.
- Vous pouvez pointer votre curseur sur les graphiques pour obtenir des informations plus détaillées, telles que les limites d’une colonne d’histogramme et le nombre de lignes qu’elle contient, ou la valeur de quantile.
Vous pouvez également générer des profils de données par programmation. Consultez la commande summarize (dbutils.data.summarize).
Utiliser des visualisations et des profils de données
Remarque
Les profils de données sont disponibles dans Databricks Runtime 9.1 LTS et versions ultérieures.
Renommer, dupliquer ou supprimer une visualisation ou un profil de données
Pour renommer, dupliquer ou supprimer une visualisation ou un profil de données, cliquez sur la flèche pointant vers le bas à droite du nom de l’onglet.
Vous pouvez également modifier le nom en cliquant directement dessus et en modifiant le nom en place.
Modifier une visualisation
Cliquez sur sous la visualisation pour ouvrir l’éditeur de visualisation. Lorsque vous avez terminé vos modifications, cliquez sur Enregistrer.
Modifier les couleurs
Vous pouvez personnaliser les couleurs d’une visualisation quand vous créez la visualisation ou en la modifiant.
- Créez ou modifiez une visualisation.
- Cliquez sur Couleurs.
- Pour modifier une couleur, cliquez sur le carré et sélectionnez la nouvelle couleur en procédant de l’une des façons suivantes :
- Cliquez dessus dans le sélecteur de couleurs.
- Entrez une valeur hexadécimale.
- Cliquez n’importe où en dehors du sélecteur de couleur pour le fermer et enregistrer les modifications.
Masquer ou afficher temporairement une série
Pour masquer une série dans une visualisation, cliquez sur la série dans la légende. Pour afficher à nouveau la série, recliquez dans la légende.
Pour afficher une seule série, double-cliquez sur la série dans la légende. Pour afficher d’autres séries, cliquez sur chacune d’elles.
Télécharger une visualisation
Pour télécharger une visualisation au format .png, cliquez sur l’icône d’appareil-photo dans la cellule du notebook ou dans l’éditeur de visualisation.
Dans une cellule de résultat, l’icône d’appareil photo apparaît en haut à droite lorsque vous déplacez le curseur sur la cellule.
Dans l’éditeur de visualisation, l’icône d’appareil-photo s’affiche lorsque vous déplacez le curseur sur le graphique. Consultez Outils de visualisation.
Ajouter une visualisation ou un profil de données à un tableau de bord
- Cliquez sur la flèche pointant vers le bas à droite du nom de l’onglet.
- Sélectionnez Ajouter au tableau de bord. Une liste des affichages de tableau de bord disponibles s’affiche, ainsi qu’une option de menu Ajouter au nouveau tableau de bord.
- Sélectionnez un tableau de bord ou sélectionnez Ajouter au nouveau tableau de bord. Le tableau de bord s’affiche, avec la visualisation ou le profil de données nouvellement ajouté.