Поделиться через


Экспорт и импорт записных книжек Databricks

На этой странице описывается, как импортировать и экспортировать записные книжки в Azure Databricks и форматы записных книжек, поддерживаемые Azure Databricks.

Поддерживаемые форматы записных книжек

Databricks может импортировать и экспортировать записные книжки в следующих форматах.

  • Исходный файл: файл, содержащий только инструкции исходного кода с расширением .scala, .py, .sql или .r.
  • HTML: записная книжка Azure Databricks с расширением .html.
  • Архив Databricks .dbc .
  • Записная книжка IPython: записная книжка Jupyter с расширением .ipynb.
  • RMarkdown: документ R Markdown с расширением .Rmd.

Импорт записной книжки

Вы можете импортировать внешнюю записную книжку из URL-адреса или файла. Также можно импортировать ZIP-архив записных книжек, экспортированных группой из рабочей области Azure Databricks.

  1. Щелкните Значок рабочей областирабочую область на боковой панели. Выполните одно из следующих действий:
    • Щелкните правой кнопкой мыши папку и выберите "Импорт".
    • Чтобы импортировать записную книжку на верхнем уровне текущей папки рабочей области, щелкните меню кебаб в правом верхнем углу и выберите "Импорт".
  2. Укажите URL-адрес или выберите файл, содержащий поддерживаемый внешний формат или ZIP-архив записных книжек, экспортированных из рабочей области Azure Databricks.
  3. Нажмите кнопку Импорт.
    • Если выбрать одну записную книжку, она будет экспортироваться в текущую папку.
    • При выборе DBC или ZIP-архива структура папок создается повторно в текущей папке, импортируется каждая записная книжка.

Преобразование файла в записную книжку

Ресурс в рабочей области определяется как записная книжка, если он имеет расширение .ipynb или содержит строку Databricks notebook source в комментарии в первой строке и имеет одно из следующих расширений: .py, .r, .scala, .sql. Любое запись или переименование записной книжки или файла, изменяющего эти условия, также изменяет тип записной книжки или файла. Например, если у вас есть файл myfile.txt с # Databricks notebook source в качестве первой строки, переименование этого файла в myfile.py преобразует его в записную книжку.

Примечание.

Преобразование между типами файлов и записных книжек может иметь непредвиденные результаты, так как записные книжки имеют определенный формат IPYNB или исходный формат. См. форматы записных книжек .

Чтобы преобразовать скрипты Python, SQL, Scala и R в записные книжки с одной ячейкой, добавьте комментарий в первую ячейку файла:

Питон

# Databricks notebook source

SQL

-- Databricks notebook source

язык программирования Scala

// Databricks notebook source

Р

# Databricks notebook source

Чтобы определить ячейки в скрипте, используйте специальный комментарий, показанный ниже. При импорте скрипта в Databricks ячейки создаются как отмеченные строками COMMAND .

Питон

# COMMAND ----------

SQL

-- COMMAND ----------

язык программирования Scala

// COMMAND ----------

Р

# COMMAND ----------

Экспорт записных книжек

Примечание.

При экспорте записной книжки в формате HTML записная книжка IPython (IPynb) или архивная (DBC) и вы не очищали выходные данные команды, выходные данные включаются в экспорт.

Чтобы экспортировать записную книжку, выберите > файлов" на панели инструментов записной книжки и выберите формат экспорта.

Чтобы экспортировать все папки в папке рабочей области в виде ZIP-архива, выполните следующие действия:

  1. Щелкните Значок рабочей областирабочую область на боковой панели.

  2. Щелкните правой кнопкой мыши папку и выберите "Экспорт".

  3. Выберите формат экспорта:

    • Архив DBC: экспорт архива Databricks, двоичного формата, включающего выходные данные метаданных и команд записной книжки.
    • Исходный файл. Экспорт ZIP-архива исходных файлов записной книжки, который можно импортировать в рабочую область Azure Databricks, используемую в конвейере CI/CD или просматривать как исходные файлы на языке по умолчанию для каждой записной книжки. Выходные данные команды записной книжки не включены.
    • Архив HTML. Экспорт ZIP-архива файлов HTML. HTML-файл каждой записной книжки можно импортировать в рабочую область Azure Databricks или просмотреть как HTML. Выходные данные команд записной книжки включены.