导出和导入 Databricks 笔记本

本页介绍如何在 Azure Databricks 中导入和导出笔记本,以及 Azure Databricks 支持的笔记本格式。

支持的笔记本格式

Databricks 可以导入和导出以下格式的笔记本:

  • 源文件:一个具有 .scala.py.sql.r 扩展名的文件,其中仅包含源代码语句。
  • HTML:一个具有 .html 扩展名的 Azure Databricks 笔记本。
  • Databricks .dbc 存档。
  • IPython 笔记本:一个具有 .ipynb 扩展名的 Jupyter 笔记本
  • RMarkdown:一个具有 .Rmd 扩展名的 R Markdown 文档

导入笔记本

可以从 URL 或文件导入外部笔记本。 还可以导入从 Azure Databricks 工作区批量导出的笔记本的 ZIP 存档。

  1. 单击边栏中的 “工作区”图标“工作区”。 执行下列操作之一:
    • 右键单击文件夹,然后选择“导入”。
    • 若要在当前工作区文件夹的顶层导入笔记本,请单击右上角的 kebab 菜单,然后选择“导入”。
  2. 指定 URL 或浏览到一个包含受支持的外部格式的文件或一个从 Azure Databricks 工作区导出的笔记本的 ZIP 存档。
  3. 单击“导入” 。
    • 如果选择单个笔记本,它会导出到当前文件夹中。
    • 如果选择 DBC 或 ZIP 存档,则会在当前文件夹中重新创建其文件夹结构并导入每个笔记本。

导入文件并将其转换为笔记本

可以通过在文件的第一个单元格中添加注释,将 Python、SQL、Scala 和 R 脚本转换为包含单个单元格的笔记本:

Python

# Databricks notebook source

SQL

-- Databricks notebook source

Scala

// Databricks notebook source

R

# Databricks notebook source

若要在脚本中定义单元格,请使用下面所示的特殊注释。 将脚本导入 Databricks 时,将创建由 COMMAND 行标记的单元格,如下所示。

Python

# COMMAND ----------

SQL

-- COMMAND ----------

Scala

// COMMAND ----------

R

# COMMAND ----------

导出笔记本

注意

如果你将笔记本导出为 HTML、IPython 笔记本 (.ipynb) 或存档 (DBC),且尚未清除命令输出,则输出将包含在导出中。

如果要导出笔记本,请在笔记本工具栏中选择“文件>”“导出”,然后选择导出格式。

将工作区文件夹中的所有文件夹导出为 ZIP 存档:

  1. 单击边栏中的 “工作区”图标“工作区”。
  2. 右键单击该文件夹,然后选择“导出”。
  3. 选择导出格式:
    • DBC 存档:导出 Databricks 存档,这是一种包含元数据和笔记本命令输出的二进制格式。
    • 源文件:导出笔记本源文件的 ZIP 存档,可将其导入 Azure Databricks 工作区、在 CI/CD 管道中使用,或使用每个笔记本的默认语言以源文件形式查看。 不包含笔记本命令输出。
    • HTML 存档:导出 HTML 文件的 ZIP 存档。 每个笔记本的 HTML 文件都可以导入到 Azure Databricks 工作区或以 HTML 格式查看。 包含笔记本命令输出。