Partager via


Sorties et résultats des notebooks

Une fois que vous avez attaché un notebook à un cluster et exécuté une ou plusieurs cellules, votre notebook aura un état et affichera des résultats. Cette section explique comment gérer l’état et les résultats d’un notebook.

Effacer l’état et les sorties des notebooks

Pour effacer l’état et les sorties du notebook, sélectionnez l’une des options Effacer en bas du menu Exécuter.

Option de menu Descriptif
Effacer toutes les sorties de cellule Efface les sorties de cellule. Cela est utile si vous partagez le notebook et que vous souhaitez éviter d’inclure des résultats.
État clair Efface l’état du notebook, y compris les définitions de fonction et de variable, les données et les bibliothèques importées.
Effacer l’état et les sorties Efface les sorties de cellule et l’état du notebook.
Effacer l’état et exécuter tout Efface l’état du notebook et démarre une nouvelle exécution.

Table des résultats

Lorsqu’une cellule est exécutée, les résultats sont affichés dans un tableau de résultats. Avec le tableau des résultats, vous pouvez effectuer les opérations suivantes :

  • Copiez une colonne ou un autre sous-ensemble des résultats tabulaires dans le presse-papiers.
  • Effectuez une recherche de texte sur la table de résultats.
  • Trier et filtrer des données.
  • Naviguez entre les cellules de la table en utilisant les touches de direction du clavier.
  • Sélectionnez une partie du nom de colonne ou de la valeur de cellule en double-cliquant et en faisant glisser pour sélectionner le texte souhaité.
  • Utilisez l’Explorateur de colonnes pour rechercher, afficher ou masquer, épingler et réorganiser des colonnes.

Tableau des résultats du notebook

Pour afficher les limites de la table de résultats, consultez Limites du tableau de résultats du notebook.

Sélectionner les données

Pour sélectionner des données dans la table de résultats, effectuez l’une des opérations suivantes.

  • Copiez les données ou un sous-ensemble dans le presse-papiers.
  • Cliquez sur une colonne ou un en-tête de ligne.
  • Cliquez dans la cellule supérieure gauche du tableau pour sélectionner l’intégralité du tableau.
  • Faites glisser votre curseur sur n’importe quel ensemble de cellules pour les sélectionner.

Pour ouvrir un panneau latéral qui affiche des informations sur la sélection, cliquez sur l’icône icône de panneau dans le coin supérieur droit, à côté du champ de Rechercher.

emplacement de l’icône de panneau

Copier les données dans le Presse-papiers

Pour copier le tableau de résultats au format CSV dans le Presse-papiers, cliquez sur la flèche vers le bas en regard de l’onglet titre du tableau, puis cliquez sur Copier les résultats dans le Presse-papiers.

Copiez la table des résultats dans le Presse-papiers.

Vous pouvez également cliquer sur la zone située en haut à gauche du tableau pour sélectionner la table complète, puis cliquer avec le bouton droit et sélectionner Copier dans le menu déroulant.

Il existe plusieurs façons de copier les données sélectionnées :

  • Appuyez sur Cmd + C sur MacOS ou Ctrl + C sur Windows pour copier les résultats dans le Presse-papiers au format CSV.
  • Cliquez avec le bouton droit et sélectionnez Copier pour copier les résultats dans le Presse-papiers au format CSV.
  • Cliquez avec le bouton droit et sélectionnez Copier en tant que pour copier les données sélectionnées au format CSV, TSV ou Markdown.

Copier les données sélectionnées dans le Presse-papiers.

Trier les résultats

Pour trier la table de résultats en fonction des valeurs d’une colonne, placez le curseur sur le nom de la colonne. Une icône contenant le nom de la colonne apparaît à droite de la cellule. Cliquez sur la flèche pour trier la colonne.

Comme trier une colonne

Pour trier sur plusieurs colonnes, maintenez enfoncée la touche Maj pendant que vous cliquez sur la flèche de tri pour les colonnes.

Le tri suit l’ordre de tri naturel par défaut. Pour appliquer un ordre de tri lexicographique, utilisez ORDER BY dans SQL ou les fonctions de SORT respectives disponibles dans votre environnement.

Filtrer les résultats

Utilisez des filtres sur une table de résultats pour examiner de plus près les données. Les filtres appliqués aux tables de résultats affectent également les visualisations, ce qui permet une exploration interactive sans modifier la requête ou le jeu de données sous-jacent. Voir Filtrer une visualisation.

Il existe plusieurs façons de créer un filtre :

Databricks Assistant

Utiliser des invites en langage naturel avec Assistant

Créez des filtres à l’aide d’instructions en langage naturel :

  1. Cliquez sur l’icône Filtrer. En haut à droite des résultats de la cellule.
  2. Dans la boîte de dialogue qui s’affiche, entrez du texte qui décrit le filtre souhaité.
  3. Cliquez sur Envoyer l’icône.. L’Assistant génère et applique le filtre pour vous.

Si vous souhaitez créer des filtres supplémentaires avec Assistant, cliquez sur l'icône Assistant DB. à côté des filtres, pour entrer une autre invite.

Consultez Filtrer les données avec des prompts en langage naturel.

Boîte de dialogue de filtre

Utiliser la boîte de dialogue de filtre intégrée

  1. Si l’Assistant Databricks n’est pas activé, cliquez sur l’icône Filtrer en haut à droite des résultats de la cellule pour ouvrir la boîte de dialogue de filtre. Vous pouvez également accéder à cette boîte de dialogue en cliquant sur le bouton Ajouter un filtre.
  2. Sélectionnez la colonne que vous souhaitez filtrer.
  3. Sélectionnez la règle de filtre à appliquer.
  4. Sélectionnez la ou les valeurs que vous souhaitez filtrer.

Exemple de filtre

Par valeur

Filtrer par une valeur spécifique

  1. Dans le tableau de résultats, cliquez avec le bouton droit sur une cellule avec cette valeur.
  2. Sélectionnez Filtrer par cette valeur dans le menu déroulant.

Valeur spécifique

Par colonne

Filtrer sur une colonne spécifique

  1. Pointez sur la colonne sur laquelle vous souhaitez filtrer.
  2. Cliquez sur l’icône de menu Kebab..
  3. Sélectionnez Filtrer.
  4. Sélectionnez les valeurs à filtrer.

Menu kebab – Filtrer

Pour activer ou désactiver temporairement un filtre, faites basculer le bouton Activé/Désactivé dans la boîte de dialogue.

Pour supprimer un filtre, cliquez sur Fermer l’icône. En regard du nom de filtre, supprimez le filtre X.

Appliquer des filtres à un jeu de données complet

Par défaut, les filtres sont appliqués uniquement aux résultats affichés dans la table des résultats. Si les données retournées sont tronquées (par exemple, lorsqu’une requête retourne plus de 10 000 lignes ou que le jeu de données est supérieur à 2 Mo), le filtre est appliqué uniquement aux lignes retournées. Une note en haut à droite de la table indique que le filtre a été appliqué aux données tronquées.

Vous pouvez choisir de filtrer le jeu de données complet à la place. Cliquez sur Données tronquées, puis choisissez Jeu de données complet. En fonction de la taille du jeu de données, il peut prendre beaucoup de temps pour que le filtre s’applique.

Appliquer des filtres au jeu de données complet.

Créer une requête à partir de résultats filtrés

À partir d’une table de résultats filtrée ou d’une visualisation dans un notebook avec SQL comme langage par défaut, vous pouvez créer une requête avec les filtres appliqués. En haut à droite de la table ou de la visualisation, cliquez sur Créer une requête. La requête est ajoutée en tant que cellule suivante dans le bloc-notes.

La requête créée applique vos filtres au-dessus de la requête d’origine. Cela vous permet d’utiliser un jeu de données plus petit et plus pertinent, ce qui permet une exploration et une analyse des données plus efficaces.

Gif montrant comment créer une requête à partir des résultats filtrés.

Explorer les colonnes

Pour faciliter l’utilisation des tables qui ont de nombreuses colonnes, vous pouvez utiliser l’Explorateur de colonnes. Pour ouvrir l’Explorateur de colonnes, cliquez sur l’icône de colonne (icône Colonne.) en haut à droite d’une table de résultats.

L’Explorateur de colonnes vous permet de :

  • Rechercher des colonnes : tapez dans la barre de recherche pour filtrer la liste des colonnes. Cliquez sur une colonne dans l’Explorateur pour y accéder dans la table de résultats.
  • Afficher ou masquer les colonnes : utilisez les cases à cocher pour contrôler la visibilité des colonnes. La case à cocher en haut active la visibilité de toutes les colonnes en même temps. Les colonnes individuelles peuvent être affichées ou masquées à l’aide des cases à cocher en regard de leurs noms.
  • Épingler des colonnes : pointez sur un nom de colonne pour afficher une icône d’épingle. Cliquez sur l’icône de l'épingle pour fixer la colonne. Les colonnes épinglées restent visibles lorsque vous faites défiler horizontalement la table de résultats.
  • Réorganiser les colonnes : cliquez et maintenez l’icône glisser (icône glisser vers la droite du nom d’une colonne), puis faites glisser-déplacer la colonne vers sa nouvelle position souhaitée. Cette opération réorganise les colonnes de la table de résultats.

Utilisez l’Explorateur de colonnes pour rechercher, afficher ou masquer, épingler et réorganiser des colonnes.

Mettre en forme les colonnes

Les en-têtes de colonnes indiquent le type de données de la colonne. Par exemple, indicateur pour la colonne de type entier indique le type de données d’entier. Pointez au-dessus de l’indicateur pour afficher le type de données.

Vous pouvez mettre en forme des colonnes dans les tables de résultats en tant que types tels que Devise, Pourcentage, URL et bien plus, avec un contrôle sur les décimales pour des tables plus claires.

Mettez en forme les colonnes à partir du menu kebab dans le nom de colonne.

mettre en forme le menu kebab de colonne

Télécharger les résultats

Par défaut, le téléchargement des résultats est activé. Pour activer/désactiver ce paramètre, consultez Gérer la possibilité de télécharger des résultats à partir de notebooks.

Vous pouvez télécharger un résultat de cellule qui contient une sortie tabulaire sur votre ordinateur local. Cliquez sur la flèche pointant vers le bas après le titre de l’onglet. Les options de menu dépendent du nombre de lignes dans le résultat et de la version de Databricks Runtime. Les résultats téléchargés sont enregistrés sur votre ordinateur local sous la forme d’un fichier CSV dont le nom correspond au nom de votre notebook.

Télécharger les résultats des cellules.

Pour les notebooks connectés aux entrepôts SQL ou au calcul sans serveur, vous pouvez également télécharger les résultats sous forme de fichier Excel.

Télécharger toutes les lignes dans un fichier Excel.

Explorer les résultats des cellules SQL

Dans un notebook Databricks, les résultats d’une cellule de langage SQL sont automatiquement disponibles en tant que DataFrame affecté à la variable _sqldf. Vous pouvez utiliser la _sqldf variable pour faire référence à la sortie SQL précédente dans les cellules Python et SQL suivantes. Pour plus d’informations, consultez Explorer les résultats des cellules SQL.

Afficher plusieurs sorties par cellule

Les notebooks et les cellules Python dans les notebooks %python non-Python prennent en charge plusieurs sorties par cellule. Par exemple, la sortie du code suivant inclut à la fois le tracé et le tableau :

import pandas as pd
from sklearn.datasets import load_iris

data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)

Redimensionner les sorties

Redimensionnez les sorties de cellule en faisant glisser le coin inférieur droit de la table ou de la visualisation.

Redimensionner la table de sortie en faisant glisser le coin inférieur droit.

Commiter les sorties de notebook dans des dossiers Git Databricks

Pour en savoir plus sur la validation des sorties de notebook .ipynb, consultez Autoriser la validation de la sortie du notebook .ipynb.

  • Le notebook doit être un fichier .ipynb
  • Les paramètres d’administration de l’espace de travail doivent autoriser la validation des sorties de notebook.