Поделиться через


Экспорт и импорт записных книжек Databricks

На этой странице описывается, как импортировать и экспортировать записные книжки в Azure Databricks и форматы записных книжек, поддерживаемые Azure Databricks.

Поддерживаемые форматы записных книжек

Databricks может импортировать и экспортировать записные книжки в следующих форматах.

  • Исходный файл: файл, содержащий только инструкции исходного кода с расширением .scala, .py, .sql или .r.
  • HTML: записная книжка Azure Databricks с расширением .html.
  • Архив Databricks .dbc .
  • Записная книжка IPython: записная книжка Jupyter с расширением .ipynb.
  • RMarkdown: документ R Markdown с расширением .Rmd.

Импорт записной книжки

Вы можете импортировать внешнюю записную книжку из URL-адреса или файла. Также можно импортировать ZIP-архив записных книжек, экспортированных группой из рабочей области Azure Databricks.

  1. Щелкните Значок рабочей области рабочую область на боковой панели. Выполните одно из следующих действий:
    • Щелкните правой кнопкой мыши папку и выберите "Импорт".
    • Чтобы импортировать записную книжку на верхнем уровне текущей папки рабочей области, щелкните меню кебаб в правом верхнем углу и выберите "Импорт".
  2. Укажите URL-адрес или выберите файл, содержащий поддерживаемый внешний формат или ZIP-архив записных книжек, экспортированных из рабочей области Azure Databricks.
  3. Нажмите кнопку Импорт.
    • Если выбрать одну записную книжку, она будет экспортироваться в текущую папку.
    • При выборе DBC или ZIP-архива структура папок создается повторно в текущей папке, импортируется каждая записная книжка.

Импорт файла и его преобразование в записную книжку

Скрипты Python, SQL, Scala и R можно преобразовать в одноэлементные записные книжки, добавив комментарий в первую ячейку файла:

Python

# Databricks notebook source

SQL

-- Databricks notebook source

Scala

// Databricks notebook source

R

# Databricks notebook source

Чтобы определить ячейки в скрипте, используйте специальный комментарий, показанный ниже. При импорте скрипта в Databricks ячейки создаются как отмеченные строками COMMAND .

Python

# COMMAND ----------

SQL

-- COMMAND ----------

Scala

// COMMAND ----------

R

# COMMAND ----------

Экспорт записных книжек

Примечание.

При экспорте записной книжки в формате HTML записная книжка IPython (IPynb) или архивная (DBC) и вы не очищали выходные данные команды, выходные данные включаются в экспорт.

Чтобы экспортировать записную книжку, выберите "Экспорт файлов>" на панели инструментов записной книжки и выберите формат экспорта.

Чтобы экспортировать все папки в папке рабочей области в виде ZIP-архива, выполните следующие действия:

  1. Щелкните Значок рабочей области рабочую область на боковой панели.
  2. Щелкните правой кнопкой мыши папку и выберите "Экспорт".
  3. Выберите формат экспорта:
    • Архив DBC: экспорт архива Databricks, двоичного формата, включающего выходные данные метаданных и команд записной книжки.
    • Исходный файл. Экспорт ZIP-архива исходных файлов записной книжки, который можно импортировать в рабочую область Azure Databricks, используемую в конвейере CI/CD, или просмотреть в виде исходных файлов в соответствии с языком по умолчанию для каждой записной книжки. Выходные данные команды записной книжки не включены.
    • Архив HTML. Экспорт ZIP-архива файлов HTML. HTML-файл каждой записной книжки можно импортировать в рабочую область Azure Databricks или просмотреть в формате HTML. Выходные данные команд записной книжки включены.