Databricks AI 環境は、AI 開発用に調整された、キュレーションされた GPU 対応ランタイムです。 これは、サーバーレス GPU 環境 4 以降でサポートされています。
この新しい環境では、機械学習用に完全に事前構成されたライブラリ スタック (PyTorch、HuggingFace Transformers などのフレームワークを含む) と GPU のネイティブ サポートを提供することで、開発を効率化します。 Databricks ノートブック、Unity カタログ、MLflow と統合され、統合されたエクスペリエンスが提供されます。 AI 環境を使用すると、ML チームは、セットアップとトラブルシューティングに数日を費やすのではなく、すぐに実行できる GPU クラスターを選択し、モデルのトレーニングをすぐに開始できます。
AI 環境に接続する
サーバーレス GPU コンピューティングに接続されている Databricks ノートブックから Databricks AI 環境を使用するには:
- ノートブックで、上部にある [接続 ] ドロップダウン メニューをクリックし、[ サーバーレス GPU] を選択します。
- [
をクリックして、[ 環境 ] サイド パネルを開きます。
- [アクセラレータ] フィールドから A10 を選択します。
- [基本環境] フィールドから AI 環境の AI v4 を選択します。
- [基本環境] フィールドから [なし] を選択した場合は、[環境のバージョン] を選択します。
- [ 適用 ] をクリックし、サーバーレス GPU コンピューティングをノートブック環境に適用することを 確認 します。
サーバーレス GPU でノートブック ジョブ用に Databricks AI 環境をセットアップするには:
- ノートブックジョブの設定で、[環境とライブラリ] セクションからノートブックの環境を編集をクリックします。
- [
をクリックして、[ 環境 ] サイド パネルを開きます。
- [基本環境] フィールドから AI 環境の AI v4 を選択します。
新しいジョブの実行では、Databricks AI 環境を取得できます。
FAQ
Databricks AI 環境と Databricks Runtime for Machine Learning の環境の違いは何ですか?
Databricks Runtime for Machine Learning と Databricks AI 環境の両方で、AI/ML のユース ケースに合わせて事前に構成されたコンピューティング環境が提供されます。 Databricks Runtime for Machine Learning はクラシック コンピューティング リソースで使用されますが、Databricks AI 環境はサーバーレス GPU コンピューティング用です。
Machine Learning 用 Databricks Runtime の環境と Databricks AI 環境の両方に共通の機械学習パッケージが含まれていますが、いくつかの違いがあります。 特に、Databricks AI 環境には、より更新されたパッケージが含まれていますが、Tensorflow と GraphFrame は含まれません。 Databricks AI 環境と Machine Learning 用 Databricks ランタイムに含まれる内容の詳細については、 サーバーレス環境のリリース ノート と Databricks ランタイムのリリース ノートを参照してください。
既知の問題
- Databricks AI 環境は、ノートブック ジョブのタスク構成の [環境とライブラリ ] フィールドでは機能しません。 そのフィールドから新しいジョブ環境を作成した場合、Databricks AI 環境を選択できないことがあります。
- Databricks AI 環境では、環境のエクスポートはサポートされていません。