Импорт и экспорт записных книжек Databricks

На этой странице описывается, как импортировать и экспортировать записные книжки в Azure Databricks и в форматах записных книжек, которые Azure Databricks поддерживаются.

Поддерживаемые форматы записных книжек

Databricks может импортировать и экспортировать записные книжки в следующих форматах.

  • Исходный файл: файл, содержащий только инструкции исходного кода с расширением .scala, .py, .sql или .r.
  • HTML: Тетрадь Azure Databricks с расширением .html.
  • Архив Databricks .dbc .
  • Записная книжка IPython: Jupyter Notebook с расширением .ipynb.
  • RMarkdown: документ R Markdown с расширением .Rmd.

Импорт записной книжки

Вы можете импортировать внешнюю записную книжку из URL-адреса или файла. Вы также можете импортировать ZIP-архив ноутбуков экспортированных оптом из рабочей области Azure Databricks.

  1. Щелкните значок записной книжки.Рабочая область на боковой панели. Выполните одно из следующих действий:
    • Щелкните правой кнопкой мыши папку и выберите "Импорт".
    • Чтобы импортировать записную книжку на верхнем уровне текущей папки рабочей области, щелкните меню кебаб в правом верхнем углу и выберите "Импорт".
  2. Укажите URL-адрес или перейдите к файлу с поддерживаемым внешним форматом или ZIP-архивом записных книжек, экспортированных из рабочей области Azure Databricks.
  3. Нажмите кнопку Импорт.
    • Если выбрать одну записную книжку, она будет экспортироваться в текущую папку.
    • При выборе DBC или ZIP-архива структура папок создается повторно в текущей папке, импортируется каждая записная книжка.

Преобразование файла в записную книжку

Ресурс в рабочей области определяется как записная книжка, если он имеет расширение .ipynb или содержит строку Databricks notebook source в комментарии в первой строке и имеет одно из следующих расширений: .py, .r, .scala, .sql. Любое запись или переименование записной книжки или файла, изменяющего эти условия, также изменяет тип записной книжки или файла. Например, если у вас есть файл myfile.txt с # Databricks notebook source в качестве первой строки, переименование этого файла в myfile.py преобразует его в записную книжку.

Примечание.

Преобразование между типами файлов и записных книжек может иметь непредвиденные результаты, так как записные книжки имеют определенный формат IPYNB или исходный формат. См. форматы записных книжек .

Чтобы преобразовать скрипты Python, SQL, Scala и R в записные книжки с одной ячейкой, добавьте комментарий в первую ячейку файла:

Python

# Databricks notebook source

SQL

-- Databricks notebook source

язык программирования Scala

// Databricks notebook source

Р

# Databricks notebook source

Чтобы определить ячейки в скрипте, используйте специальный комментарий, показанный ниже. При импорте скрипта в Databricks создаются ячейки, которые отмечаются строками COMMAND .

Python

# COMMAND ----------

SQL

-- COMMAND ----------

язык программирования Scala

// COMMAND ----------

Р

# COMMAND ----------

Экспорт записных книжек

Примечание.

При экспорте записной книжки в формате HTML, IPython notebook (.ipynb) или архив (DBC), если вы не очищали выходные данные команды, выходные данные включаются в экспорт.

Чтобы экспортировать записную книжку:

  1. Открыв записную книжку, щелкните "Файл " на панели инструментов записной книжки, а затем нажмите кнопку "Экспорт...".
  2. Выберите тип файла экспорта в раскрывающемся меню.
  3. Если в качестве типа файла экспорта выбрана записная книжка IPython, HTML или DBC, можно выбрать, включать выходные данные ячеек или нет, установив или сняв Включить данные выходов.
  4. Нажмите кнопку "Экспорт".

Экспорт всех записных книжек в папке рабочей области в виде ZIP-архива:

  1. Щелкните значок записной книжки.Рабочая область на боковой панели.

  2. Щелкните правой кнопкой мыши папку и выберите "Скачать как".

  3. Выберите формат скачивания:

    • Архив DBC (только ноутбуки): экспорт архива Databricks, двоичного формата, содержащего метаданные и выходные данные команд записных книжек.
    • Zip — источник (только файлы и записная книжка): экспортируйте ZIP-архив исходных файлов записной книжки, который можно импортировать в рабочую область Azure Databricks, использовать в конвейере CI/CD или просматривать как исходные файлы на языке программирования по умолчанию для каждой записной книжки. Результаты выполнения команд записной книжки не включены.
    • Zip - HTML (только записные книжки): экспорт ZIP-архив записных книжек в формате HTML. HTML-файл каждой записной книжки можно импортировать в рабочую область Azure Databricks или просмотреть как HTML. Выходные данные команд ноутбука включены.