Sorties et résultats des notebooks

Une fois que vous avez attaché un notebook à un cluster et exécuté une ou plusieurs cellules, votre notebook aura des sorties d’état et d’affichages. Cette section expliquer comment gérer l’état et les sorties d’un notebook.

Effacer l’état et les sorties des notebooks

Pour effacer l’état et les sorties du notebook, sélectionnez l’une des options Effacer en bas du menu Exécuter.

Option de menu Description
Effacer toutes les sorties de cellule Efface les sorties de cellule. Cela est utile si vous partagez le bloc-notes et que vous ne souhaitez pas inclure de résultats.
État clair Efface l’état du notebook, y compris les définitions de fonction et de variable, les données et les bibliothèques importées.
Effacer l’état et les sorties Efface les sorties de cellule et l’état du notebook.
Effacer l’état et exécuter tout Efface l’état du notebook et démarre une nouvelle exécution.

afficher les résultats

Lorsqu’une cellule est exécutée, les résultats de la table retournent un maximum de 10 000 lignes ou 2 Mo, selon la valeur la plus petite.

Les résultats du texte renvoient par défaut un maximum de 50 000 caractères. Avec Databricks Runtime 12.2 LTS et versions ultérieures, vous pouvez augmenter cette limite en paramétrant la propriété spark.databricks.driver.maxReplOutputLength de la configuration Spark.

Explorer des résultats des cellules SQL dans des notebooks Python en mode natif à l’aide de Python

Vous pouvez charger des données en utilisant SQL et les explorer en utilisant Python. Dans un notebook Databricks Python, les résultats de table d’une cellule en langage SQL sont automatiquement rendues disponibles en tant que DataFrame Python. Pour plus d’informations, consultez Explorer les résultats des cellules SQL dans les notebooks Python.

Nouvelle table de résultats de la cellule

Important

Cette fonctionnalité est disponible en préversion publique.

Vous pouvez désormais sélectionner un rendu de nouvelle table de résultats de la cellule. Avec la nouvelle table de résultats, vous pouvez effectuer les opérations suivantes :

  • Copiez une colonne ou un autre sous-ensemble de résultats tabulaires dans le Presse-papiers.
  • Effectuez une recherche de texte sur la table de résultats.
  • Trier et filtrer des données.
  • Naviguez entre les cellules de la table en utilisant les touches de direction du clavier.
  • Sélectionnez une partie du nom de colonne ou de la valeur de cellule en double-cliquant et en faisant glisser pour sélectionner le texte souhaité.

Pour activer la nouvelle table de résultats, cliquez sur Nouvelle table de résultats dans le coin supérieur droit des résultats de la cellule et modifiez le sélecteur de bascule de DÉSACTIVÉ sur ACTIVÉ.

nouveau sélecteur d’affichage de résultat

Quand la fonctionnalité est activée, vous pouvez cliquer sur des en-têtes de lignes ou de colonnes pour sélectionner des lignes ou des colonnes entières et vous pouvez cliquer sur la cellule supérieure gauche de la table pour sélectionner la table entière. Vous pouvez déplacer votre curseur dans n’importe quel ensemble de cellules rectangulaires pour les sélectionner.

Pour copier les données sélectionnées dans le Presse-papiers, appuyez sur Cmd + c sur MacOS ou Ctrl + c sur Windows, ou cliquez avec le bouton droit et sélectionnez Copier à partir du menu déroulant.

Pour rechercher du texte dans la table de résultats, entrez le texte dans la zone Rechercher. Les cellules correspondantes sont mises en surbrillance.

Pour ouvrir un panneau latéral qui affiche des informations sur la sélection, cliquez sur l’icône icône de panneau de l’icône du panneau dans le coin supérieur droit, à côté de la zone Rechercher.

emplacement de l’icône de panneau

Les en-têtes de colonnes indiquent le type de données de la colonne. Par exemple, indicateur pour la colonne de type entier indique le type de données d’entier. Pointez au-dessus de l’indicateur pour afficher le type de données.

Trier et filtrer des résultats

Quand vous utilisez le nouveau rendu du tableau des résultats d’une cellule, vous pouvez trier et filtrer les résultats.

Pour trier la table en fonction des valeurs d’une colonne, placez le curseur sur le nom de la colonne. À droite de la cellule contenant le nom de colonne, une icône s’affiche. Cliquez sur la flèche pour trier la colonne. Des clics successifs permettent de boucler entre les états suivants : tri par ordre croissant, tri par ordre décroissant, non trié.

Comme trier une colonne

Pour trier sur plusieurs colonnes, maintenez enfoncée la touche Maj pendant que vous cliquez sur la flèche de tri pour les colonnes.

Pour créer un filtre, cliquez sur icône filtre en haut à droite des résultats de la cellule. Dans la boîte de dialogue qui s’affiche, sélectionnez la colonne sur laquelle filtrer, et la règle et la valeur de filtrage à appliquer. Par exemple :

Exemple de filtre

Pour ajouter un autre filtre, cliquez sur Bouton Ajouter un filtre.

Pour activer ou désactiver temporairement un filtre, faites basculer le bouton Activé/Désactivé dans la boîte de dialogue. Pour supprimer un filtre, cliquez sur le X en regard du nom du filtre Supprimer un filtre X.

Pour filtrer par une valeur spécifique, cliquez avec le bouton droit sur une cellule ayant cette valeur, puis sélectionnez Filtrer par cette valeur dans le menu déroulant.

Valeur spécifique

Vous pouvez également créer un filtre à partir du menu kebab dans le nom de la colonne :

Menu kebab – Filtrer

Les filtres sont appliqués seulement aux résultats affichés dans la table des résultats. Si les données retournées sont tronquées (par exemple, quand une requête retourne plus de 64 000 lignes), le filtre est appliqué seulement aux lignes retournées.

Télécharger les résultats

Par défaut, le téléchargement des résultats est activé. Pour activer/désactiver ce paramètre, consultez Gérer la possibilité de télécharger des résultats à partir de notebooks.

Vous pouvez télécharger un résultat de cellule qui contient une sortie tabulaire sur votre ordinateur local. Cliquez sur la flèche pointant vers le bas après le titre de l’onglet. Les options de menu dépendent du nombre de lignes dans le résultat et de la version de Databricks Runtime. Les résultats téléchargés sont enregistrés sur votre ordinateur local en tant que fichier CSV nommé export.csv.

Télécharger les résultats de cellule

Afficher plusieurs sorties par cellule

Les notebooks et les cellules Python dans les notebooks %python non-Python prennent en charge plusieurs sorties par cellule. Par exemple, la sortie du code suivant inclut à la fois le tracé et le tableau :

import pandas as pd
from sklearn.datasets import load_iris

data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)

Commiter les sorties de notebook dans des dossiers Git Databricks

Pour en savoir plus sur la validation des sorties de notebook .ipynb, consultez Autoriser la validation de la sortie du notebook .ipynb.

  • Le notebook doit être un fichier .ipynb
  • Les paramètres d’administration de l’espace de travail doivent autoriser la validation des sorties de notebook.