次の方法で共有


AI モデルおよび ML モデルをトレーニングする

Azure Databricks は、マネージド クラスター ランタイムから完全なサーバーレス GPU 環境まで、さまざまな機械学習ニーズに合わせた柔軟なコンピューティング ソリューションを提供します。

Compute 説明
サーバーレス GPU コンピューティング カスタムの単一ノードおよびマルチノードのディープ ラーニング ワークロード向けに最適化されたサーバーレス GPU コンピューティング環境。
Machine Learning 用 Databricks ランタイム クラシック 機械学習とディープ ラーニング ワークロード用の事前構築済みライブラリを備えたクラシック コンピューティング環境。

サーバーレス GPU コンピューティング (ベータ)

Important

この機能は ベータ版です。 ワークスペース管理者は、[ プレビュー] ページからこの機能へのアクセスを制御できます。 Azure Databricks プレビューの管理を参照してください。

サーバーレス GPU コンピューティング は、Databricks サーバーレス エコシステム内の特殊なオファリングです。 これは、LLM の微調整やコンピューター ビジョン モデルのトレーニングなど、カスタムの単一ノードおよびマルチノードディープ ラーニング ワークロード用に最適化されています。

主な特徴は次のとおりです。

  • 即時可用性: 基になるクラスター インフラストラクチャを管理する必要がなくなります。これにより、ノートブックをサーバーレス GPU リソースに直接接続できます。
  • ハイ パフォーマンス ハードウェア: コスト効率の高いタスクのために A10 GPU へのアクセスを提供します。
  • マネージド環境: 完全なカスタマイズ用の既定の基本環境、または Transformers や Ray などの一般的な ML パッケージが事前に読み込まれた AI 環境を提供します。
  • 柔軟なスケーリング: 複数の GPU とノードにわたる分散トレーニングをサポートします。

Machine Learning 用 Databricks ランタイム

Databricks Runtime for Machine Learning は、事前に構築されたインフラストラクチャを使用してコンピューティング リソースの作成を自動化する特殊なランタイムです。 これは、従来の機械学習とディープ ラーニングの両方に対して、包括的ですぐに使用できる環境を必要とするユーザー向けに設計されています。

主な特徴は次のとおりです。

  • プレインストール済みライブラリ: PyTorch、TensorFlow、XGBoost などの一般的なライブラリが含まれており、頻繁な更新プログラムと最適化されたサポートを受け取ります。
  • コンピューティングの汎用性: CPU ベースと GPU ベースのインスタンスタイプの両方をサポートします。AWS Graviton を含め、価格からパフォーマンスを向上させます。
  • 最適化: Photon との統合を提供して、Spark SQL、DataFrame、および特徴エンジニアリング タスクを高速化します。
  • アクセス制御: Unity カタログを介したセキュリティで保護されたデータ アクセスには、専用のアクセス モードが必要です。