Databricks ノートブック間でコードを共有する
この記事では、Python ファイルを作成およびインポートする方法など、ファイルを使用してコードをモジュール化する方法について説明します。
Databricks ではマルチタスク ジョブもサポートされています。これにより、ノートブックを複雑な依存関係を持つワークフローに結合できます。 詳細については、「ワークフローのスケジュールと調整」を参照してください。
ファイルを使用してコードをモジュール化する
Databricks Runtime 11.3 LTS 以降では、Azure Databricks ワークスペースでソース コード ファイルを作成して管理し、必要に応じてこれらのファイルをノートブックにインポートできます。 Databricks リポジトリを使用して、ファイルを Git リポジトリと同期することもできます。 詳細については、「Python および R モジュールの処理」と「Git と Databricks Git フォルダーの統合」を参照してください。
ファイルを作成する
ファイルを作成するには、次の手順を実行します。
- ワークスペース内のフォルダーに移動します。
- フォルダー名を右クリックし、>[ファイルの作成] を選択します。
- ファイルの名前を入力し、[ファイルの作成] をクリックするか、Enter キーを押します。 ファイルがエディター ウィンドウで開きます。 変更は自動的に保存されます。
ファイルを開く
ワークスペース内のファイルに移動し、それをクリックします。 ファイルの名前にカーソルを合わせると、ファイル パスが表示されます。
ノートブックにファイルをインポートする
標準の Python インポート コマンドを使用して、ノートブックにファイルをインポートできます。
次のファイルがあるとします。
そのファイルをノートブックにインポートし、ファイルで定義されている関数を呼び出すことができます:
ファイルを実行する
エディターからファイルを実行できます。 これはテストに役立ちます。 ファイルを実行するには、コード領域にカーソルを置き、Shift + Enter キーを押してセルを実行するか、セル内のコードを強調表示して Shift + Ctrl + Enter キーを押して、選択したコードのみを実行します。
ファイルを削除する
ワークスペース メニューにアクセスしてワークスペース内のファイルや他の項目を削除する方法については、「フォルダー」と「ワークスペース オブジェクトの操作」を参照してください。
ファイル名を変更する
開いているファイルのタイトルを変更するには、タイトルをクリックしてインラインで編集するか、[ファイル] > [名前の変更] をクリックします。
ファイルへのアクセスを制御する
Azure Databricks アカウントに Premium プランがある場合は、ワークスペースのアクセス制御を使用して、ファイルにアクセスできるユーザーを制御できます。