Partilhar via


Importar e exportar notebooks dos Databricks

Esta página descreve como importar e exportar cadernos no Azure Databricks e os formatos de cadernos que o Azure Databricks suporta.

Formatos de notebook suportados

O Databricks pode importar e exportar blocos de notas nos seguintes formatos:

  • Arquivo de origem: um arquivo que contém apenas instruções de código-fonte com a extensão .scala, .py, .sql, ou .r.
  • HTML: Um caderno Azure Databricks com a extensão .html.
  • Arquivo Databricks .dbc .
  • Notebook IPython: Um notebook Jupyter com a extensão .ipynb.
  • RMarkdown: Um documento R Markdown com a extensão .Rmd.

Importar um bloco de notas

Você pode importar um bloco de anotações externo de um URL ou de um arquivo. Também pode importar um arquivo ZIP contendo cadernos exportados em massa de um espaço de trabalho do Azure Databricks.

  1. Clique no ícone Bloco de Notas.Espaço de trabalho na barra lateral. Proceda de uma das seguintes formas:
    • Clique com o botão direito do mouse em uma pasta e selecione Importar.
    • Para importar um bloco de anotações no nível superior da pasta de espaço de trabalho atual, clique no menu kebab no canto superior direito e selecione Importar.
  2. Especifique o URL ou navegue até um ficheiro contendo um formato externo suportado ou um arquivo ZIP de cadernos exportados de um espaço de trabalho do Azure Databricks.
  3. Clique em Importar.
    • Se você escolher um único bloco de anotações, ele será exportado na pasta atual.
    • Se você escolher um arquivo DBC ou ZIP, sua estrutura de pastas será recriada na pasta atual e cada bloco de anotações será importado.

Converter um ficheiro num bloco de notas

Um ativo no espaço de trabalho é identificado como um notebook se tiver uma .ipynb extensão, ou contiver a cadeia de caracteres Databricks notebook source num comentário na primeira linha e tiver uma das seguintes extensões: .py, .r, .scala, .sql. Qualquer gravação ou renomeação de um bloco de anotações ou arquivo que altere essas condições também altera o tipo do bloco de anotações ou arquivo. Por exemplo, se tiveres um arquivo myfile.txt que tenha # Databricks notebook source como a primeira linha, renomear esse arquivo para myfile.py converte-o em um caderno.

Nota

A conversão entre tipos de arquivo e notebook pode ter resultados inesperados, já que os notebooks têm um formato IPYNB ou de origem específico. Consulte Formatos de cadernos.

Para converter scripts em Python, SQL, Scala e R em cadernos de célula única, adicione um comentário à primeira célula do ficheiro:

Python

# Databricks notebook source

SQL

-- Databricks notebook source

linguagem de programação Scala

// Databricks notebook source

R

# Databricks notebook source

Para definir células em um script, use o comentário especial mostrado abaixo. Quando importares o script para o Databricks, as células COMMAND são criadas como indicado pelas linhas mostradas.

Python

# COMMAND ----------

SQL

-- COMMAND ----------

linguagem de programação Scala

// COMMAND ----------

R

# COMMAND ----------

Exportar blocos de notas

Nota

Quando exportas um caderno de notas como HTML, IPython notebook (.ipynb) ou arquivo (DBC) e não limpaste as saídas de comando, as saídas são incluídas na exportação.

Para exportar um bloco de notas:

  1. Com o bloco de notas aberto, clique em Ficheiro na barra de ferramentas do bloco de notas e, em seguida, clique em Exportar....
  2. Selecione o tipo de ficheiro de exportação no menu suspenso.
  3. Se selecionou o tipo de ficheiro de exportação notebook IPython, HTML ou arquivo DBC, pode optar por incluir ou não as saídas das células, selecionando ou limpando Incluir saídas.
  4. Clique em Exportar.

Para exportar todos os cadernos numa pasta de espaço de trabalho como um arquivo ZIP:

  1. Clique no ícone Bloco de Notas.Espaço de trabalho na barra lateral.

  2. Clique com o botão direito do mouse na pasta e selecione Baixar como.

  3. Selecione o formato de download:

    • DBC Archive (notebooks only): exporte um arquivo de Databricks, um formato binário que inclui metadados e saídas de comandos dos notebooks.
    • Zip - Fonte (apenas bloco de notas + ficheiros): Exportar um arquivo ZIP de ficheiros de origem do bloco de notas, que pode ser importado para um espaço de trabalho Azure Databricks, utilizado num processo CI/CD, ou visualizado como ficheiros de origem na língua padrão de cada bloco de notas. As saídas de comando do notebook não estão incluídas.
    • Zip - HTML (apenas blocos de notas): Exporte um arquivo ZIP dos blocos de notas em formato HTML. O ficheiro HTML de cada caderno pode ser importado para um espaço de trabalho do Azure Databricks ou visualizado como HTML. As saídas de comando do notebook estão incluídas.