このページでは、Azure Databricks で Notebooks をインポートおよびエクスポートする方法と、Azure Databricks でサポートされている Notebooks 形式について説明します。
サポートされている Notebooks 形式
Databricks では Notebooks を次の形式でインポートおよびエクスポートできます。
- ソース ファイル: 拡張子が
.scala、.py、.sql、または.rのソース コード ステートメントのみを含むファイル。 - HTML: 拡張子が
.htmlの Azure Databricks Notebooks。 - Databricks
.dbcアーカイブ。 - IPython Notebook: 拡張子が の
.ipynb。 - RMarkdown: 拡張子が の
.Rmd。
Notebooks をインポートする
URL またはファイルから外部 Notebooks をインポートできます。 Azure Databricks ワークスペースから一括エクスポートされた Notebooks の ZIP アーカイブをインポートすることもできます。
- [
サイドバーのワークスペース。 次のいずれかの操作を行います。
- フォルダーを右クリックし、[インポート] を選択します。
- 現在のワークスペース フォルダーの最上位レベルにある Notebooks をインポートするには、右上にある kebab メニューをクリックし、[インポート] を選択します。
- URL を指定するか、サポートされている外部形式、または Azure Databricks ワークスペースからエクスポートされた Notebooks の ZIP アーカイブを含むファイルを参照します。
-
[インポート] をクリックします。
- 1 つの Notebooks を選択すると、現在のフォルダーにエクスポートされます。
- DBC または ZIP アーカイブを選択すると、そのフォルダー構造が現在のフォルダーに再作成され、各 Notebooks がインポートされます。
ファイルをノートブックに変換する
ワークスペース内の資産は、 .ipynb 拡張子を持つ場合、または最初の行のコメントに文字列 Databricks notebook source が含まれており、 .py、 .r、 .scala、 .sqlのいずれかの拡張子を持つ場合、ノートブックとして識別されます。 これらの条件を変更するノートブックまたはファイルの書き込みまたは名前変更は、ノートブックまたはファイルの種類も変更します。 たとえば、1 行目が myfile.txt である # Databricks notebook source ファイルがある場合、そのファイルの名前を myfile.py に変更すると、Notebooks に変換されます。
Note
ノートブックの IPYNB またはソース形式が特定の場合、ファイルとノートブックの種類を変換すると、予期しない結果が生じる可能性があります。 「ノートブックの形式」を参照してください。
Python、SQL、Scala、R スクリプトを単一セルノートブックに変換するには、ファイルの最初のセルにコメントを追加します。
Python
# Databricks notebook source
SQL
-- Databricks notebook source
スカラ (プログラミング言語)
// Databricks notebook source
R
# Databricks notebook source
スクリプトでセルを定義するには、次に示す特別なコメントを使用します。 スクリプトを Databricks にインポートすると、示されている COMMAND 行でマークされたセルが作成されます。
Python
# COMMAND ----------
SQL
-- COMMAND ----------
スカラ (プログラミング言語)
// COMMAND ----------
R
# COMMAND ----------
ノートブックをエクスポートする
Note
Notebooks を HTML、IPython Notebooks (.ipynb)、またはアーカイブ (DBC) としてエクスポートし、コマンド出力を消去していない場合は、その出力がエクスポートに含まれます。
ノートブックをエクスポートするには:
- ノートブックを開いた状態で、ノートブック ツール バーの [ ファイル ] をクリックし、[ エクスポート...] をクリックします。
- ドロップダウン メニューからエクスポート ファイルの種類を選択します。
- エクスポート ファイルの種類として IPython Notebook、HTML、または DBC アーカイブを選択した場合は、[出力を含める] をオンまたはオフにして、セル出力を 含めるかどうかを選択できます。
- [ エクスポート] をクリックします。
ワークスペース フォルダー内のすべてのノートブックを ZIP アーカイブとしてエクスポートするには:
[
サイドバーのワークスペース。
フォルダーを右クリックし、別名でダウンロード を選択します。
ダウンロード形式を選択します。
- DBC アーカイブ (ノートブックのみ): Databricks アーカイブ (メタデータとノートブック コマンド出力を含むバイナリ形式) をエクスポートします。
- Zip - ソース (ノートブック + ファイルのみ): ノートブック ソース ファイルの ZIP アーカイブをエクスポートします。これは、Azure Databricks ワークスペースにインポートしたり、CI/CD パイプラインで使用したり、各ノートブックの既定の言語でソース ファイルとして表示したりできます。 Notebooks コマンドの出力は含まれません。
- Zip - HTML (ノートブックのみ): ノートブックの ZIP アーカイブを HTML 形式でエクスポートします。 各ノートブックの HTML ファイルは、Azure Databricks ワークスペースにインポートすることも、HTML として表示することもできます。 Notebooks コマンドの出力が含まれています。