Partager via


Gérer le format du bloc-notes

Cet article décrit le format de notebook par défaut dans Azure Databricks, comment modifier le format de votre bloc-notes et comment gérer les validations de sortie si votre bloc-notes se trouve dans un dossier contrôlé par la source.

Par défaut, les notebooks dans Databricks sont créés dans le format .ipynb IPython ou Jupyter. Vous pouvez également choisir d’utiliser le format source à la place.

Vous pouvez toujours importer et exporter des blocs-notes dans différents formats. Voir Importer et exporter des carnets Databricks.

Formats des notebooks

Databricks prend en charge la création et la modification de notebooks dans deux formats : IPYNB (valeur par défaut) et source.

Vous pouvez gérer les fichiers sources, y compris les notebooks, à l’aide de dossiers Git. Seuls certains types de ressources Databricks sont pris en charge dans les dossiers Git. Le format affecte la façon dont les notebooks sont validés dans les référentiels distants, comme décrit dans le tableau ci-dessous.

Format source du notebook Descriptif
source Format de base qui capture uniquement le code source, avec un suffixe qui signale le langage de code, tel que .py, .scala.r et .sql.
IPYNB (Jupyter) Format riche qui capture le code source, l’environnement de notebook, les définitions de visualisation, les widgets de bloc-notes et les sorties facultatives. Un notebook IPYNB peut contenir du code dans n’importe quel langage pris en charge par les notebooks Databricks (malgré la py partie de .ipynb). Avec le format IPYNB, vous pouvez contrôler les versions des résultats d’un notebook en même temps que le notebook lui-même.

Le format IPYNB prend également en charge une meilleure expérience d’affichage pour les notebooks Databricks sur les dépôts Git distants. Si vous utilisez GitHub ou GitLab, vous pouvez activer des fonctionnalités qui vous donnent des diff améliorés de vos notebooks dans les pull requests, ce qui facilite l'affichage et la révision des modifications de code apportées à un notebook.

Pour en savoir plus sur la prise en charge par GitHub des diffs enrichis des notebooks IPYNB, consultez Aperçu des fonctionnalités : Rich Jupyter Notebook Diffs. Pour en savoir plus sur la prise en charge de GitLab pour les différentiels de notebook IPYNB, consultez Fichiers Jupyter Notebook.

Pour distinguer les blocs-notes de format source des fichiers Python, Scala et SQL standard, Azure Databricks ajoute le commentaire «Databricks notebook source » en haut des notebooks Python, Scala et SQL. Ce commentaire garantit qu’Azure Databricks analyse correctement le fichier en tant que notebook plutôt qu’un fichier de script.

Modifier le paramètre de format de notebook par défaut

Les notebooks IPYNB sont le format par défaut lors de la création d’un bloc-notes sur Azure Databricks.

Pour modifier la valeur par défaut au format source Azure Databricks, connectez-vous à votre espace de travail Azure Databricks, cliquez sur votre profil en haut à droite de la page, puis cliquez sur Paramètres et accédez au développeur. Modifiez le format du bloc-notes par défaut sous l’en-tête des paramètres de l’éditeur .

Modifier le format de notebook par défaut dans les paramètres du développeur de votre profil

Convertir le format du bloc-notes

Vous pouvez convertir un notebook existant en un autre format via l’interface utilisateur Azure Databricks.

Pour convertir un bloc-notes existant dans un autre format :

  1. Ouvrez le bloc-notes dans votre espace de travail.

  2. Sélectionnez Fichier dans le menu de l’espace de travail, sélectionnez Format bloc-notes, puis choisissez le format souhaité. Vous pouvez choisir Jupyter (.ipynb) (recommandé) ou Source (.scala, .py, .sql, .r). Le format actuel du notebook est grisé et est accompagné d’une coche à côté.

    Menu fichier d’espace de travail développé, affichant l’option de format du notebook.

Pour plus d'informations sur les types de notebooks pris en charge dans Azure Databricks, consultez Importer et exporter des notebooks Databricks.

Gérer les validations de sortie de notebook IPYNB

Les sorties sont les résultats de l’exécution d’un notebook sur la plateforme Databricks, y compris les affichages et les visualisations de tables. Pour les notebooks IPYNB dans les dossiers contrôlés par la source, vous pouvez gérer la façon dont les sorties de notebook sont validées dans le référentiel distant.

Autoriser la validation des résultats du notebook .ipynb

Les sorties peuvent être validées uniquement si un administrateur d’espace de travail a activé cette fonctionnalité. Par défaut, le paramètre d’administration pour les dossiers Git n’autorise pas la validation de la sortie du notebook .ipynb. Si vous disposez de privilèges d’administrateur pour l’espace de travail, vous pouvez modifier ce paramètre :

  1. Accédez aux paramètres d'administration et aux > dans la console administrateur Azure Databricks.

  2. Sous Dossiers Git, choisissez Autoriser les dossiers Git à exporter les sorties IPYNB , puis sélectionnez Autoriser : Les sorties IPYNB peuvent être activées.

    Console d’administration : autoriser les dossiers Git à exporter les sorties IPYNB.

Importante

Lorsque les sorties sont incluses, les configurations de visualisation et de tableau de bord sont ajoutées dans les notebooks .ipynb que vous créez.

Contrôler les validations d’artefacts de sortie de notebook IPYNB

Lorsque vous validez un .ipynb fichier, Databricks crée un fichier de configuration qui vous permet de contrôler la façon dont vous validez les sorties : .databricks/commit_outputs.

  1. Si vous disposez d’un .ipynb fichier notebook mais qu'il n'y a pas de fichier de configuration dans votre référentiel distant, accédez à la boîte de dialogue État Git.

  2. Dans la boîte de dialogue de notification, sélectionnez Créer le fichier de configuration commit_outputs.

    Interface utilisateur de validation du notebook : bouton de création de fichier commit_outputs.

Vous pouvez également générer des fichiers de configuration à partir du menu Fichier . Le menu Fichier a un contrôle pour mettre à jour automatiquement le fichier de configuration dans lequel vous pouvez spécifier l’inclusion ou l’exclusion de sorties pour un notebook IPYNB spécifique.

  1. Dans le menu Fichier , sélectionnez Valider les sorties des blocs-notes.

    Éditeur de notebook : contrôle et statut de validation des sorties de notebook.

  2. Dans la boîte de dialogue, confirmez votre choix pour valider les sorties du bloc-notes.

    Boîte de dialogue de validation des sorties de notebooks.