管理筆記本格式

本頁說明 Azure Databricks 中的預設筆記本格式、如何更改筆記本格式,以及如果你的筆記本位於原始碼控制資料夾中,如何管理輸出提交。

根據預設,Databricks 中的筆記本會以 .ipynb (IPython 或 Jupyter) 格式建立。 您也可以選擇改用來源格式。

您仍然可以以各種格式匯入和匯出筆記本。 請參閱 Databricks 筆記本的匯入和導出

筆記本格式

Databricks 支援以兩種格式建立和編輯筆記本:IPYNB (預設值) 和來源。

您可以使用 Git 資料夾來管理來源檔案,包括筆記本。 Git 資料夾中僅支援某些 Databricks 資產類型。 格式會影響筆記本如何提交至遠端資料庫,如下表所述。

筆記本來源格式 說明
來源 僅用於擷取原始程式碼的基本格式,後綴用於表示程式語言,例如 .py.scala.r.sql
IPYNB (Jupyter) 豐富的格式,可擷取原始程式碼、筆記本環境、視覺效果定義、筆記本小工具,以及選擇性輸出。 IPYNB 筆記本可以包含任何 Databricks 筆記本所支援語言的程式碼(儘管在 py部分有 .ipynb)。 使用IPYNB格式,您可以選擇性地將筆記本的輸出和筆記本本身一同進行版本控制。

IPYNB 格式也支援遠端 Git 存放庫上 Databricks 筆記本的更佳檢視體驗。 如果你使用 GitHub 或 GitLab,可以啟用功能,使你在合併請求中更容易增強查看和進行筆記本的變更和代碼審查。

欲了解更多關於 GitHub 對 IPYNB 筆記本豐富的差異比對的支援,請參閱 功能預覽: Rich Jupyter Notebook Diffs。 想了解更多關於 GitLab 對 IPYNB 筆記本差異的支援,請參見 Jupyter Notebook files

為了區分原始碼格式筆記本與一般的 Python、Scala 和 SQL 檔案,Azure Databricks 會在 Python、Scala 和 SQL 筆記本的頂端加上註解「Databricks notebook source」。 此註解確保 Azure Databricks 正確解析該檔案為筆記本,而非腳本檔案。

變更預設筆記本格式設定

IPYNB 筆記本是 Azure Databricks 建立新筆記本時的預設格式。

要將預設格式改為 Azure Databricks 原始碼格式,請登入你的 Azure Databricks 工作區,點擊頁面右上角的個人檔案,然後點選 Settings,然後切換到 Developer。 在 [編輯器設定] 的 [] 標題下變更筆記本格式的預設值。

變更開發人員設定中的配置檔的預設記事本格式

轉換筆記本格式

你可以透過 Azure Databricks 介面將現有筆記本轉換成其他格式。

若要將現有的筆記本轉換成另一種格式:

  1. 在工作區中開啟筆記本。

  2. 從工作區功能表中選取 [ 檔案 ],選取 [筆記本格式],然後選擇您想要的格式。 您可以選擇 Jupyter(.ipynb)(建議)Source(.scala、.py、.sql、.r)。 筆記本目前的格式顯示為灰色,且旁邊有勾選標記。

    展開的工作區檔案選單顯示了筆記本格式選項。

欲了解更多 Azure Databricks 支援的筆記本類型,請參見 Import and export Databricks notebooks

管理IPYNB筆記本輸出認可

輸出是在 Databricks 平臺上執行筆記本的結果,包括數據表顯示和視覺效果。 對於受到原始檔控制的資料夾中的 IPYNB 筆記本,您可以管理如何將筆記本的輸出結果提交到遠端存放庫。

允許提交 .ipynb 筆記本輸出

只有在工作區管理員已啟用此功能時,才能提交輸出。 預設情況下,Git 資料夾的系統管理設定不允許提交 .ipynb 筆記本輸出。 如果您有工作區的系統管理員許可權,您可以變更此設定:

  1. 在Azure Databricks管理員控制台中,進入Admin settings>Workspace settings

  2. 在 [Git 資料夾] 下,選擇 [允許 Git 資料夾匯出 IPYNB 輸出],然後選擇 [允許]:[可以切換開啟 IPYNB 輸出]。

    管理主控台:允許 Git 資料夾匯出 IPYNB 輸出。

重要

當輸出包含在內時,您建立的.ipynb 筆記本中將包含視覺化和儀錶板配置。

控制IPYNB筆記本輸出工件提交

當您提交 .ipynb 檔案時,Databricks 會建立設定檔,讓您控制提交輸出的方式:.databricks/commit_outputs

  1. 如果您有 .ipynb 筆記本檔案,但在遠端存放庫中沒有設定檔,請移至 [Git 狀態] 對話框。

  2. 在通知對話框中,選取 [建立commit_outputs配置檔]。

    Notebook 提交 UI:建立 commit_outputs 檔案按鈕。

您也可以從 [檔案] 功能表產生組態檔。 [檔案] 選單中有一個選項,可以自動更新配置檔,您可以在其中指定特定 IPYNB 筆記本的輸出包含或排除。

  1. 在 [檔案] 功能表中,選取 [提交筆記本輸出]。

    Notebook 編輯器:提交筆記本輸出狀態和控制。

  2. 在對話框中,確認您確認提交筆記本輸出。

    提交筆記本輸出對話框。