本頁說明如何在 Azure Databricks 中匯入與匯出筆記本,以及 Azure Databricks 支援的筆記本格式。
支援的筆記本格式
Databricks 可以以下列格式匯入和匯出筆記本:
- 原始程式檔:僅包含原始程式碼語句的檔案,檔案的副檔名為
.scala、.py、.sql或.r。 - HTML:一個擁有副檔名
.html的 Azure Databricks 筆記本。 - Databricks
.dbc封存。 - IPython Notebook:一個具有 延伸名的
.ipynb。 - RMarkdown:一個R Markdown文件,副檔名為。
匯入筆記本
您可以從 URL 或檔案匯入外部筆記本。 你也可以匯入從 Azure Databricks 工作區大量匯出的筆記本 ZIP 檔案庫。
- 按一下
側邊欄中的工作區。 執行下列其中一個動作:
- 以滑鼠右鍵按下資料夾,然後選取 匯入。
- 若要在目前工作區資料夾的最上層匯入筆記本,請按下右上方的kebab選單,然後選取 [匯入 ]。
- 指定 URL 或瀏覽至包含支援的外部格式的檔案,或匯出自 Azure Databricks 工作區的筆記本的 ZIP 壓縮檔。
- 按一下 匯入。
- 如果您選擇單一筆記本,則會在目前資料夾中匯出它。
- 如果您選擇 DBC 或 ZIP 封存,則會在目前資料夾中重新建立其資料夾結構,並匯入每個筆記本。
將檔案轉換成筆記本
在工作區中,如果資產具有.ipynb延伸模組,或在第一行註解中包含字串Databricks notebook source,且具有下列其中一個延伸模組:.py、.r、.scala、.sql,則將該資產識別為筆記本。 任何變更這些條件的筆記本或檔案的寫入或重新命名,也會變更筆記本或檔案的類型。 例如,如果您的檔案 myfile.txt 的第一行是 # Databricks notebook source,將該檔案重新命名為 myfile.py,會將其轉換為筆記本。
注意
在檔案和筆記本類型之間轉換可能會有非預期的結果,因為筆記本具有特定的IPYNB或來源格式。 請參閱 筆記本格式。
要將 Python、SQL、Scala 和 R 腳本轉換成單格筆記本,請在檔案的第一個格子加上註解:
Python
# Databricks notebook source
SQL
-- Databricks notebook source
程式語言 Scala
// Databricks notebook source
R
# Databricks notebook source
若要在腳本中定義儲存格,請使用如下所示的特殊批注。 當您將腳本匯入 Databricks 時,儲存格會透過顯示的 COMMAND 行來建立。
Python
# COMMAND ----------
SQL
-- COMMAND ----------
程式語言 Scala
// COMMAND ----------
R
# COMMAND ----------
匯出筆記本
注意
當您將筆記本匯出為 HTML、IPython Notebook(.ipynb)或封存檔案(DBC),且您尚未 清除命令輸出時,這些輸出將會包括在匯出內容中。
若要匯出記事本:
- 開啟筆記本後,按一下筆記本工具列中的 [檔案 ],然後按一下 [匯出...]。
- 從下拉式功能表中選取匯出檔案類型。
- 如果你選擇了 IPython 筆記本、HTML 或 DBC 壓縮檔作為匯出檔案類型,你可以選擇或清除 「包含輸出」來選擇是否包含儲存格輸出。
- 按一下匯出。
若要將工作區資料夾中的所有筆記本匯出為 ZIP 封存:
按一下
側邊欄中的工作區。
以滑鼠右鍵按一下資料夾,然後選取選項 下載為。
選取下載格式:
- DBC 封存 (僅限筆記本):匯出 Databricks 封存,這是包含中繼資料和筆記本命令輸出的二進位格式。
- Zip - 原始碼(僅限筆記本+檔案):匯出筆記本原始碼檔案的 ZIP 壓縮檔,可匯入 Azure Databricks 工作區、用於 CI/CD 管線,或以每個筆記本的預設語言作為原始碼檔案。 不包含筆記本命令輸出。
- Zip - HTML (僅限筆記本):以 HTML 格式匯出筆記本的 ZIP 封存。 每個筆記本的 HTML 檔案可以匯入 Azure Databricks 工作區,或以 HTML 形式查看。 包含筆記本命令輸出。