Partilhar via


Importar e exportar notebooks dos Databricks

Esta página descreve como importar e exportar blocos de notas no Azure Databricks e os formatos de bloco de notas suportados pelo Azure Databricks.

Formatos de notebook suportados

O Databricks pode importar e exportar blocos de notas nos seguintes formatos:

  • Arquivo de origem: um arquivo que contém apenas instruções de código-fonte com a extensão .scala, .py, .sql, ou .r.
  • HTML: Um bloco de anotações do Azure Databricks com a extensão .html.
  • Arquivo Databricks .dbc .
  • Notebook IPython: Um notebook Jupyter com a extensão .ipynb.
  • RMarkdown: Um documento R Markdown com a extensão .Rmd.

Importar um bloco de notas

Você pode importar um bloco de anotações externo de um URL ou de um arquivo. Você também pode importar um arquivo ZIP de blocos de anotações exportados em massa de um espaço de trabalho do Azure Databricks.

  1. Clique no ícone Bloco de Notas.Espaço de trabalho na barra lateral. Proceda de uma das seguintes formas:
    • Clique com o botão direito do mouse em uma pasta e selecione Importar.
    • Para importar um bloco de anotações no nível superior da pasta de espaço de trabalho atual, clique no menu kebab no canto superior direito e selecione Importar.
  2. Especifique a URL ou navegue até um arquivo que contenha um formato externo com suporte ou um arquivo ZIP de blocos de anotações exportados de um espaço de trabalho do Azure Databricks.
  3. Clique em Importar.
    • Se você escolher um único bloco de anotações, ele será exportado na pasta atual.
    • Se você escolher um arquivo DBC ou ZIP, sua estrutura de pastas será recriada na pasta atual e cada bloco de anotações será importado.

Converter um ficheiro num bloco de notas

Um ativo no espaço de trabalho é identificado como um notebook se tiver uma .ipynb extensão, ou contiver a cadeia de caracteres Databricks notebook source num comentário na primeira linha e tiver uma das seguintes extensões: .py, .r, .scala, .sql. Qualquer gravação ou renomeação de um bloco de anotações ou arquivo que altere essas condições também altera o tipo do bloco de anotações ou arquivo. Por exemplo, se tiveres um arquivo myfile.txt que tenha # Databricks notebook source como a primeira linha, renomear esse arquivo para myfile.py converte-o em um caderno.

Nota

A conversão entre tipos de arquivo e notebook pode ter resultados inesperados, já que os notebooks têm um formato IPYNB ou de origem específico. Consulte Formatos de cadernos.

Para converter scripts Python, SQL, Scala e R em blocos de anotações de célula única, adicione um comentário à primeira célula do arquivo:

Python

# Databricks notebook source

SQL

-- Databricks notebook source

linguagem de programação Scala

// Databricks notebook source

R

# Databricks notebook source

Para definir células em um script, use o comentário especial mostrado abaixo. Quando você importa o script para Databricks, as COMMAND células são criadas conforme marcado pelas linhas mostradas.

Python

# COMMAND ----------

SQL

-- COMMAND ----------

linguagem de programação Scala

// COMMAND ----------

R

# COMMAND ----------

Exportar blocos de notas

Nota

Quando você exporta um bloco de anotações como HTML, IPython notebook (.ipynb) ou archive (DBC) e não limpou as saídas de comando, as saídas são incluídas na exportação.

Para exportar um bloco de notas:

  1. Com o bloco de notas aberto, clique em Ficheiro na barra de ferramentas do bloco de notas e, em seguida, clique em Exportar....
  2. Selecione o tipo de ficheiro de exportação no menu suspenso.
  3. Se você selecionou IPython notebook, HTML ou arquivo DBC como o tipo de arquivo de exportação, você pode optar por incluir saídas de célula ou não, marcando/desmarcando Incluir saídas.
  4. Clique em Exportar.

Para exportar todos os cadernos numa pasta de espaço de trabalho como um arquivo ZIP:

  1. Clique no ícone Bloco de Notas.Espaço de trabalho na barra lateral.

  2. Clique com o botão direito do mouse na pasta e selecione Baixar como.

  3. Selecione o formato de download:

    • DBC Archive (notebooks only): exporte um arquivo de Databricks, um formato binário que inclui metadados e saídas de comandos dos notebooks.
    • Zip - Origem (somente bloco de anotações + arquivos): exporte um arquivo ZIP de arquivos de origem do bloco de anotações, que podem ser importados para um espaço de trabalho do Azure Databricks, usados em um pipeline de CI/CD ou exibidos como arquivos de origem no idioma padrão de cada bloco de anotações. As saídas de comando do bloco de anotações não estão incluídas.
    • Zip - HTML (apenas blocos de notas): Exporte um arquivo ZIP dos blocos de notas em formato HTML. O arquivo HTML de cada bloco de anotações pode ser importado para um espaço de trabalho do Azure Databricks ou exibido como HTML. As saídas de comando do bloco de anotações estão incluídas.