Partekatu honen bidez:


Importación y exportación de cuadernos de Databricks

En esta página se describe cómo importar y exportar cuadernos en Azure Databricks y los formatos de cuaderno que admite Azure Databricks.

Formatos de cuaderno admitidos

Databricks puede importar y exportar cuadernos en los siguientes formatos:

  • Archivo de código fuente: archivo que contiene solo instrucciones de código fuente con la extensión .scala, .py, .sql o .r.
  • HTML: cuaderno de Azure Databricks con la extensión .html.
  • Archivo .dbc de Databricks.
  • Cuaderno de IPython: cuaderno de Jupyter Notebook con la extensión .ipynb.
  • RMarkdown: documento R Markdown con la extensión .Rmd.

Importación de un cuaderno

Puede importar un cuaderno externo desde una dirección URL o un archivo. También puede importar un archivo ZIP de cuadernos exportados de forma masiva desde un área de trabajo de Azure Databricks.

  1. Haga clic en el icono Bloc de notas.Área de trabajo de la barra lateral. Realice una de las siguientes acciones:
    • Haga clic con el botón derecho en una carpeta y seleccione Importar.
    • Para importar un cuaderno en el nivel superior de la carpeta del área de trabajo actual, haga clic en el menú de tres puntos de la esquina superior derecha y seleccione Importar.
  2. Especifique la dirección URL o busque un archivo que contenga un formato externo compatible o un archivo ZIP de cuadernos exportados desde un área de trabajo de Azure Databricks.
  3. Haga clic en Import.
    • Si solo elige un cuaderno, se exportará en la carpeta actual.
    • Si elige un archivo DBC o ZIP, se volverá a crear su estructura de carpetas en la carpeta actual y se importará cada cuaderno.

Conversión de un archivo en un cuaderno

Un recurso del área de trabajo se identifica como un cuaderno si tiene una .ipynb extensión o contiene la cadena Databricks notebook source en un comentario de la primera línea y tiene una de las siguientes extensiones: .py, .r, .scala, .sql. Cualquier escritura o cambio de nombre de un cuaderno o archivo que cambie estas condiciones, también cambia el tipo de cuaderno o archivo. Por ejemplo, si tienes un archivo myfile.txt que tiene # Databricks notebook source como la primera línea, renombrar ese archivo a myfile.py lo convierte en un cuaderno.

Nota

La conversión entre tipos de archivo y cuaderno puede tener resultados inesperados, ya que los cuadernos tienen un formato IPYNB o de origen específico. Consulta Formatos de cuaderno.

Para convertir scripts de Python, SQL, Scala y R en cuadernos de una sola celda, agregue un comentario a la primera celda del archivo:

Pitón

# Databricks notebook source

SQL

-- Databricks notebook source

Scala

// Databricks notebook source

R

# Databricks notebook source

Para definir las celdas de un script, use el comentario especial que se muestra a continuación. Al importar el script a Databricks, las celdas se crean como marcadas por las líneas COMMAND mostradas.

Pitón

# COMMAND ----------

SQL

-- COMMAND ----------

Scala

// COMMAND ----------

R

# COMMAND ----------

Exportación de cuadernos

Nota

Si se exporta un cuaderno como HTML, cuaderno de IPython (.ipynb) o archivo (DBC) y no se han borrado las salidas del comando, estas se incluyen en la exportación.

Para exportar un cuaderno:

  1. Con el cuaderno abierto, haga clic en Archivo en la barra de herramientas del cuaderno y, a continuación, haga clic en Exportar....
  2. Seleccione el tipo de archivo de exportación en el menú desplegable.
  3. Si seleccionó el archivo IPython Notebook, HTML o DBC como tipo de archivo de exportación, puede elegir incluir salidas de celda o no activando o desactivando Incluir salidas.
  4. Haga clic en Exportar.

Para exportar todos los cuadernos de una carpeta del área de trabajo como archivo ZIP:

  1. Haga clic en el icono Bloc de notas.Área de trabajo de la barra lateral.

  2. Haga clic con el botón derecho en la carpeta y seleccione Descargar como.

  3. Seleccione el formato de descarga:

    • Archivo DBC (solo cuadernos): exporte un archivo de Databricks, un formato binario que incluya metadatos y salidas de comandos de cuaderno.
    • Zip - Fuente (solo cuadernos + archivos): Exporte un archivo ZIP de los archivos fuente de cuadernos, que pueden importarse en un área de trabajo de Azure Databricks, utilizarse en una canalización de CI/CD o visualizarse como archivos fuente en el idioma predeterminado de cada cuaderno. No se incluyen las salidas del comando del cuaderno.
    • Zip : HTML (solo cuadernos): exporte un archivo ZIP de los cuadernos en formato HTML. El archivo HTML de cada cuaderno se puede importar en un área de trabajo de Azure Databricks o verse como HTML. Se incluyen las salidas del comando del cuaderno.