ディープラーニング

2025-05-06

この記事では、Azure Databricks でディープラーニングモデルを開発および微調整するための PyTorch、Tensorflow、分散トレーニングの使用について簡単に説明します。また、これらのツールの使用方法を示すノートブックの例を含むページへのリンクも含まれています。

Azure Databricks でのディープラーニングワークフローの最適化に関する一般的なガイドラインについては、Azure Databricks でのディープラーニングの推奨事項に関する記事をご覧ください。
Azure Databricks で大規模な言語モデルと生成 AI を使用する方法については、次をご覧ください。
- Databricks の大規模言語モデル (LLM)。
- Databricks での AI および機械学習

PyTorch

PyTorch は Databricks Runtime ML に含まれており、GPU で高速化されたテンソル計算と、ディープラーニングネットワークを構築するための高度な機能を提供します。 Databricks で PyTorch を使用して、単一ノードトレーニングまたは分散トレーニングを実行できます。「PyTorch」を参照してください。 PyTorch と MLflow を使用したエンドツーエンドのチュートリアルノートブックについては、「チュートリアル: Azure Databricks でのエンドツーエンドのディープラーニングモデル」を参照してください。

TensorFlow

Databricks Runtime ML には TensorFlow と TensorBoard が含まれているため、パッケージをインストールせずにこれらのライブラリを使用できます。 TensorFlow は、CPU、GPU、GPU のクラスターでのディープラーニングや、一般的な数値計算をサポートしています。 TensorBoard には、機械学習とディープラーニングのワークフローのデバッグと最適化に役立つ視覚化ツールが用意されています。単一ノードトレーニングと分散トレーニングの例については、「TensorFlow」を参照してください。

分散トレーニング

ディープラーニングモデルはデータ集中型で計算を集中的に行うため、分散トレーニングが重要になる場合があります。 Ray、TorchDistributor、および DeepSpeed との統合を使用した分散型ディープラーニングの例については、「分散型トレーニング」を参照してください。