Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se describe el formato de cuaderno predeterminado en Azure Databricks, cómo cambiar el formato del cuaderno y cómo administrar confirmaciones de salida si el cuaderno está en una carpeta controlada por código fuente.
De forma predeterminada, los cuadernos de Databricks se crean en formato .ipynb
(IPython o Jupyter). También puede optar por usar el formato de origen en su lugar.
Todavía puede importar y exportar cuadernos en varios formatos. Consulta Exportación e importación de cuadernos de Databricks.
Formatos de cuaderno
Databricks admite la creación y edición de cuadernos en dos formatos: IPYNB (valor predeterminado) y origen.
Puedes administrar archivos de origen, incluidos cuadernos, mediante carpetas de Git. Solo se admiten determinados tipos de recursos de Databricks en carpetas de Git. El formato afecta a cómo se confirman los cuadernos en repositorios remotos, como se describe en la tabla siguiente.
Formato de origen del cuaderno | Descripción |
---|---|
fuente | Un formato básico que solo captura el código fuente, con un sufijo que indica el lenguaje de código, como .py , .scala , .r y .sql . |
IPYNB (Jupyter) | Un formato enriquecido que captura el código fuente, el entorno del cuaderno, las definiciones de visualización, los widgets de cuaderno y las salidas opcionales. Un cuaderno IPYNB puede contener código en cualquier lenguaje admitido por los cuadernos de Databricks (a pesar de la parte py de .ipynb ). Con el formato IPYNB, puede opcionalmente llevar control de versiones tanto del contenido del cuaderno como de su salida. |
El formato IPYNB también admite una mejor experiencia de visualización para cuadernos de Databricks en repositorios de Git remotos. Si usas GitHub o GitLab, puedes habilitar características que proporcionan diffs mejorados de tus cuadernos en los pull requests, lo que facilita la visualización y hacer revisiones de código de los cambios en un cuaderno.
Para obtener más información sobre la compatibilidad de GitHub con diferencias avanzadas de cuadernos IPYNB, consulte Vista previa de funciones: Diferencias avanzadas de Jupyter Notebook. Para obtener más información sobre la compatibilidad de GitLab con las diferencias en los cuadernos IPYNB, consulte Archivos de Jupyter Notebook.
Para distinguir los cuadernos de formato de origen de los archivos de Python, Scala y SQL normales, Azure Databricks agrega el comentario "Databricks notebook source
" a la parte superior de los cuadernos python, Scala y SQL. Este comentario garantiza que Azure Databricks analiza correctamente el archivo como un cuaderno en lugar de un archivo de script.
Cambiar la configuración predeterminada del formato del cuaderno
Los cuadernos IPYNB son el formato predeterminado al crear un cuaderno en Azure Databricks.
Para cambiar el valor predeterminado al formato de origen de Azure Databricks, inicia sesión en el área de trabajo de Azure Databricks, haz clic en el perfil en la esquina superior derecha de la página y, después, haz clic en Configuración y ve a Desarrollador. Cambie el formato predeterminado del cuaderno en la sección de configuración del editor bajo el encabezado .
Conversión del formato de cuaderno
Puede convertir un cuaderno existente a otro formato a través de la interfaz de usuario de Azure Databricks.
Para convertir un cuaderno existente a otro formato:
Abra el cuaderno en el área de trabajo.
Seleccione Archivo en el menú del área de trabajo, seleccione Formato de cuaderno y elija el formato que desee. Puedes elegir Jupyter (.ipynb) (recomendado) u Source (.scala, .py, .sql, .r). El formato actual del cuaderno está atenuado y tiene una marca de verificación junto a él.
Para más información sobre los tipos de cuadernos admitidos en Azure Databricks, consulte Exportación e importación de cuadernos de Databricks.
Administrar confirmaciones de salida del cuaderno IPYNB
Las salidas son los resultados de ejecutar un cuaderno en la plataforma de Databricks, incluidas las tablas y las visualizaciones. En el caso de los cuadernos IPYNB en carpetas controladas por código fuente, puede administrar cómo se confirman las salidas del cuaderno en el repositorio remoto.
Habilitación de la confirmación de la salida del cuaderno .ipynb
Los resultados solo se pueden confirmar si un administrador del área de trabajo ha habilitado esta función. De forma predeterminada, la configuración administrativa de las carpetas de Git no permite confirmar la salida del notebook (.ipynb
). Si tiene privilegios de administrador para el área de trabajo, puede cambiar esta configuración:
Ve a Configuración de administrador>Configuración del área de trabajo en la consola de administrador de Azure Databricks.
En Carpetas Git, elija Permitir que las carpetas Git exporten salidas IPYNB y, después, seleccione Permitir: se pueden activar las salidas IPYNB.
Importante
Cuando se incluyen resultados, las configuraciones de visualización y panel de control se incluyen en los cuadernos de.ipynb
que crea.
Control de las confirmaciones de artefactos de salida del cuaderno IPYNB
Al confirmar un archivo de .ipynb
, Databricks crea un archivo de configuración que te permite controlar cómo confirmas los resultados: .databricks/commit_outputs
.
Si tiene un archivo de cuaderno de
.ipynb
pero no hay ningún archivo de configuración en el repositorio remoto, vaya al cuadro de diálogo Estado de Git.En el cuadro de diálogo de notificación, seleccione Crear archivo de configuración commit_outputs.
También puede generar archivos de configuración desde el menú Archivo. El menú Archivo tiene un control para actualizar automáticamente el archivo de configuración, donde puedes especificar la inclusión o exclusión de salidas de un cuaderno IPYNB específico.
En el menú Archivo, selecciona Confirmar salidas de cuadernos.
En el cuadro de diálogo, confirma su elección para confirmar las salidas del cuaderno.