此頁面說明如何在 Azure Databricks 中匯入和匯出筆記本,以及 Azure Databricks 支援的筆記本格式。
支援的筆記本格式
Databricks 可以以下列格式匯入和匯出筆記本:
- 原始程式檔:檔案,只包含擴展名
.scala為、.py.sql或.r的原始程式碼語句。 - HTML:擴展名為 的
.htmlAzure Databricks 筆記本。 - Databricks
.dbc封存。 - IPython Notebook:。
- RMarkdown:擴展名。
匯入筆記本
您可以從 URL 或檔案匯入外部筆記本。 您也可以從 Azure Databricks 工作區匯入大量導出的筆記本 ZIP 封存。
- 按一下
側邊欄中的工作區。 執行下列其中一個動作:
- 以滑鼠右鍵按下資料夾,然後選取 匯入。
- 若要在目前工作區資料夾的最上層匯入筆記本,請按下右上方的kebab選單,然後選取 [匯入 ]。
- 指定 URL 或瀏覽至包含所支援外部格式的檔案,或從 Azure Databricks 工作區匯出之筆記本的 ZIP 封存。
- 按一下 匯入。
- 如果您選擇單一筆記本,則會在目前資料夾中匯出它。
- 如果您選擇 DBC 或 ZIP 封存,則會在目前資料夾中重新建立其資料夾結構,並匯入每個筆記本。
將檔案轉換成筆記本
在工作區中,如果資產具有.ipynb延伸模組,或在第一行註解中包含字串Databricks notebook source,且具有下列其中一個延伸模組:.py、.r、.scala、.sql,則將該資產識別為筆記本。 任何變更這些條件的筆記本或檔案的寫入或重新命名,也會變更筆記本或檔案的類型。 例如,如果您的檔案 myfile.txt 的第一行是 # Databricks notebook source,將該檔案重新命名為 myfile.py,會將其轉換為筆記本。
注意
在檔案和筆記本類型之間轉換可能會有非預期的結果,因為筆記本具有特定的IPYNB或來源格式。 請參閱 筆記本格式。
若要將 Python、SQL、Scala 和 R 腳本轉換成單一數據格筆記本,請將批註新增至檔案的第一個數據格:
Python
# Databricks notebook source
SQL
-- Databricks notebook source
程式語言 Scala
// Databricks notebook source
R
# Databricks notebook source
若要在腳本中定義儲存格,請使用如下所示的特殊批注。 當您將腳本匯入 Databricks 時,單元格會以顯示的行標示 COMMAND 來建立。
Python
# COMMAND ----------
SQL
-- COMMAND ----------
程式語言 Scala
// COMMAND ----------
R
# COMMAND ----------
匯出筆記本
注意
當您將筆記本導出為 HTML、IPython Notebook(.ipynb)或封存 (DBC),且您尚未 清除命令輸出時,輸出會包含在導出中。
若要匯出記事本:
- 開啟筆記本後,按一下筆記本工具列中的 [檔案 ],然後按一下 [匯出...]。
- 從下拉式功能表中選取匯出檔案類型。
- 如果您選取 IPython 筆記本、HTML 或 DBC 封存作為匯出檔案類型,您可以勾選/取消勾選包含輸出以選擇是否包含儲存格輸出。
- 按一下匯出。
若要將工作區資料夾中的所有筆記本匯出為 ZIP 封存:
按一下
側邊欄中的工作區。
以滑鼠右鍵按一下資料夾,然後選取選項 下載為。
選取下載格式:
- DBC 封存 (僅限筆記本):匯出 Databricks 封存,這是包含中繼資料和筆記本命令輸出的二進位格式。
- Zip - 來源 (僅限筆記本 + 檔案):匯出筆記本來源檔案的 ZIP 封存,這些封存可以匯入 Azure Databricks 工作區、用於 CI/CD 管線,或以每個筆記本的預設語言檢視為來源檔案。 不包含筆記本命令輸出。
- Zip - HTML (僅限筆記本):以 HTML 格式匯出筆記本的 ZIP 封存。 每個筆記本的 HTML 檔案都可以匯入 Azure Databricks 工作區,或檢視為 HTML。 包含筆記本命令輸出。