Unity Catalog ボリュームにファイルをアップロードする

[ボリュームにアップロードする] UI を使うと、構造化データ、半構造化データ、非構造化データなど、任意の形式のファイルを Unity Catalog ボリュームにアップロードできます。 「ボリュームを作成して操作する」を参照してください。

5 ギガバイトより大きいファイルをアップロードすることはできません。

  • Databricks Runtime 13.3 LTS 以降の Databricks では、割り当てられたアクセス モードまたは共有アクセス モードでコンピューティング用の .whl ライブラリを格納するためにボリュームを使うことをお勧めします。
  • Databricks Runtime 13.3 LTS 以降の Databricks では、割り当てられたアクセス モードまたは共有アクセス モードでコンピューティング用の JAR スクリプトと init スクリプトを格納するためにボリュームを使うことをお勧めします。

アップロードしたファイルから Unity Catalog マネージド テーブルを作成できます。 「ボリュームからテーブルを作成する」を参照してください。

ボリュームにアップロードされたファイルに対して、さまざまな機械学習ワークロードとデータ サイエンス ワークロードを実行することもできます。 さらに、ライブラリ、証明書、および任意の形式のその他の構成ファイル (クラスターのライブラリ、ノートブック スコープのライブラリ、ジョブの依存関係を構成するために使う .whl または .txt など) をアップロードできます。

ボリュームにファイルをアップロードするための UI にはどこからアクセスできますか?

この UI には、次の方法でアクセスできます。

  • サイドバーで、[新規]>[データの追加]>[ボリュームにファイルをアップロードする] の順にクリックします。
  • Catalog Explorer で、追加>ボリュームにアップロードする をクリックします。 Catalog Explorer でボリュームを参照しているときに、ボリュームまたはボリューム内のディレクトリにファイルを直接アップロードすることもできます。
  • ノートブック内で、[ファイル]>[ボリュームにファイルをアップロードする] の順にクリックします。

Note

ボリュームは、Databricks Runtime 13.3 LTS 以降でのみサポートされています。 Databricks Runtime 12.2 LTS 以前では、/Volumes パスに対する操作が成功する可能性がありますが、想定どおりに Unity Catalog ボリュームにデータを保持するのではなく、コンピューティング クラスターにアタッチされたエフェメラル ストレージ ディスクにデータが書き込まれる可能性もあります。

開始する前に

Unity Catalog ボリュームにファイルをアップロードする前に、次のものが必要です。

  • Unity Catalog が有効になっているワークスペース。 詳細については、「Unity Catalog の設定と管理」を参照してください。
  • ファイルのアップロード先のボリュームに対する WRITE VOLUME 権限。
  • 親スキーマに対する USE SCHEMA 権限
  • 親カタログに対する USE CATALOG アクセス許可。

詳細については、「Unity Catalog の権限とセキュリティ保護可能なオブジェクト」を参照してください。

ボリュームにファイルをアップロードする手順

Unity Catalog ボリュームにファイルをアップロードするには、次の操作を行います。

  1. [新規]>[データの追加] の順にクリックします。
  2. [ボリュームにファイルをアップロードする] をクリックします。
  3. ボリュームまたはボリューム内のディレクトリを選択するか、ボリューム パスを貼り付けます。
    • ターゲット スキーマにボリュームが存在しない場合は、ダイアログを使って新しいボリュームを作成できます。
    • 必要に応じて、ターゲット ディレクトリへの完全なパスを指定して、ターゲット ボリューム内に新しいディレクトリを作成できます。
  4. ブラウザー ボタンをクリックするか、ドロップ ゾーンに直接ファイルをドラッグ アンド ドロップします。