Databricks での AI と Machine Learning

[アーティクル]
07/25/2024

この記事では、Azure Databricks に用意されている、AI および ML ワークフローの構築と監視に役立つツールについて説明します。この図は、これらのコンポーネントがどのように連携して、モデルの開発とデプロイのプロセスを実装するのに役立つかを示しています。

機械学習の図: Databricks でのモデルの開発とデプロイ

機械学習とディープラーニングに Databricks を使用する理由

Databricks を使うと、生データから、提供されるモデルのすべての要求と応答が保存される推論テーブルまで、モデルの開発とデプロイのプロセスのすべてのステップが、1 つのプラットフォームで提供されます。データサイエンティスト、データエンジニア、ML エンジニア、DevOps は、同じツールセットと、データの信頼できる唯一の情報源を使って、自分の仕事を行うことができます。

データインテリジェンスプラットフォームでは、ML プラットフォームとデータスタックは同じシステムです。 ML プラットフォームは、データレイヤーの上に構築されます。モデルや関数など、すべてのデータ資産と成果物は、1 つのカタログで検出でき、管理されます。データとモデルに 1 つのプラットフォームを使うと、生データから運用モデルまでの系列を追跡できます。組み込まれたデータとモデルモニタリングは、プラットフォームにも格納されるテーブルに品質メトリックを保存するため、モデルのパフォーマンスの問題の根本原因を簡単に特定できます。 Databricks が ML の完全なライフサイクルと MLOps をサポートする方法について詳しくは、「Azure Databricks での MLOps ワークフロー」と「MLOps スタックとは」をご覧ください。

データインテリジェンスプラットフォームの主要なコンポーネントの一部を次に示します。

タスク	コンポーネント
データ、機能、モデル、特徴量のガバナンスと管理。検出、バージョン管理、系列も。	Unity Catalog
データ、データ品質、モデル予測品質の変化を追跡する	レイクハウス監視、推論テーブル
特徴の開発と管理	特徴エンジニアリング
モデルをトレーニングする	Databricks AutoML、Databricks ノートブック
モデル開発の追跡	MLflow 追跡
カスタムモデルを提供する	Mosaic AI Model Serving
LLM のデプロイ	Foundation Model API、外部モデル
自動化されたワークフローと運用対応の ETL パイプラインの構築	Databricks ワークフロー
Git 統合	Databricks Git フォルダー

Databricks でのディープラーニング

ディープラーニングアプリケーションのインフラストラクチャを構成することは容易でない場合があります。

Databricks Runtime for Machine Learning は、TensorFlow、PyTorch、Keras などの最も一般的なディープラーニングライブラリの互換性のあるバージョンが組み込まれたクラスターと、Petastorm、Hyperopt、Horovod などのサポートライブラリを使用して、これを処理します。 Databricks Runtime ML クラスターには、ドライバーとサポートライブラリを含む、事前に構成された GPU サポートも組み込まれています。また、ML ワークフローや AI アプリケーションをスケーリングするための計算処理を並列化する Ray のようなライブラリもサポートしています。

Databricks Runtime ML クラスターには、ドライバーとサポートライブラリを含む、事前に構成された GPU サポートも組み込まれています。 Mosaic AI Model Serving を使用すると、追加の構成なしでディープラーニングモデル用のスケーラブルな GPU エンドポイントを作成できます。

機械学習アプリケーションの場合、Databricks では、Databricks Runtime for Machine Learning を実行するクラスターを使用することをお勧めします。「Databricks Runtime ML を使用してクラスターを作成する」を参照してください。

Databricks でディープラーニングを開始するには、以下を参照してください。

Databricks での大規模言語モデル (LLM) と生成 AI

Databricks Runtime for Machine Learning には、既存の事前トレーニング済みモデルやその他のオープンソースライブラリをワークフローに統合できる、Hugging Face Transformers や LangChain などのライブラリが含まれています。 Databricks MLflow 統合により、トランスフォーマーパイプライン、モデル、処理コンポーネントで MLflow 追跡サービスを簡単に使用できます。さらに、John Snow Labs などのパートナーの OpenAI モデルまたはソリューションを Azure Databricks ワークフローに統合することもできます。

Azure Databricks を使用すると、特定のタスクのデータに対して LLM をカスタマイズできます。 Hugging Face や DeepSpeed などのオープンソースツールをサポートすることで、基盤 LLM を効率的に取得し、独自のデータでトレーニングして、特定のドメインとワークロードに対する精度を高めることができます。その後、生成 AI アプリケーションでカスタム LLM を活用できます。

さらに、Databricks には Foundation Model API と外部モデルが用意されており、サービスエンドポイントから最先端のオープンモデルにアクセスしてクエリを実行できます。 Foundation Model API を使うと、開発者は独自のモデルデプロイを維持することなく、高品質の生成 AI モデルを利用するアプリケーションを迅速かつ簡単に構築できます。

SQL ユーザー向けに、Databricks により、SQL データアナリストがデータパイプラインとワークフロー内で直接、OpenAI を含む LLM モデルにアクセスするために使用できる AI 関数が提供されます。「Azure Databricks の AI 関数」を参照してください。

Databricks Runtime for Machine Learning

Databricks Runtime for Machine Learning (Databricks Runtime ML) により、事前に構築された機械学習、ディープラーニングインフラストラクチャ (最も一般的な ML および DL ライブラリを含む) を使用してクラスターの作成が自動化されます。 Databricks Runtime ML の各バージョンのライブラリの完全な一覧については、リリースノートを参照してください。

機械学習ワークフロー用の Unity Catalog のデータにアクセスするには、クラスターの [アクセスモード] を単一ユーザー (割り当て済み) にする必要があります。共有クラスターは、Databricks Runtime for Machine Learning に対応していません。さらに、Databricks Runtime ML は、TableACLs クラスターまたは spark.databricks.pyspark.enableProcessIsolation config が true に設定されたクラスターではサポートされていません。

Databricks Runtime ML を使用してクラスターを作成する

クラスターを作成するときは、[Databricks Runtime バージョン] ドロップダウンメニューから Databricks Runtime ML バージョンを選択します。 CPU および GPU 対応の ML ランタイムの両方を使用できます。

Databricks Runtime ML を選択する

ノートブックのドロップダウンメニューからクラスターを選択すると、クラスター名の右側に Databricks Runtime のバージョンが表示されます。

Databricks Runtime ML バージョンを表示する

GPU 対応の ML ランタイムを選択した場合は、互換性のあるドライバーの種類とワーカータイプを選択するように求められます。互換性のないインスタンスの種類は、ドロップダウンメニューで淡色表示されます。 GPU 対応のインスタンスの種類は、[GPU 加速化] ラベルの下に一覧表示されます。

Note

機械学習ワークフロー用の Unity Catalog のデータにアクセスするには、クラスターの [アクセスモード] を単一ユーザー (割り当て済み) にする必要があります。共有クラスターは、Databricks Runtime for Machine Learning に対応していません。クラスターの作成方法の詳細については、「コンピューティング構成リファレンス」を参照してください。

Photon と Databricks Runtime ML

Databricks Runtime 15.2 ML 以上を実行する CPU クラスターを作成するとき、Photon を有効にすることを選択できます。 Photon では、Spark SQL、Spark DataFrames、特徴エンジニアリング、GraphFrames、xgboost4j を使用してアプリケーションのパフォーマンスを向上させます。 Spark RDD、Pandas UDF、JVM 以外の言語 (Python など) を使用するアプリケーションのパフォーマンス向上は想定されていません。したがって、XGBoost、PyTorch、TensorFlow などの Python パッケージでは、Photon の改善は確認されないでしょう。

Spark RDD API と Spark MLlib には、Photon との限定的な互換性があります。 Spark RDD または Spark MLlib を使用して大規模なデータセットを処理すると、Spark メモリの問題が発生する場合があります。「Spark のメモリの問題」を参照してください。

Databricks Runtime ML に含まれているライブラリ

Databricks Runtime ML には、さまざまな一般的な ML ライブラリが含まれています。ライブラリは各リリースで更新され、新しい機能と修正プログラムが追加されました。

Databricks は、サポートされているライブラリのサブセットを最上位層ライブラリに指定しました。これらのライブラリでは、Databricks の更新頻度が高速化し、ランタイムリリースごとに最新のパッケージリリースに更新されます (依存関係の競合がない場合)。 Databricks では、最上位層ライブラリに対して高度なサポート、テスト、埋め込みの最適化も行われます。

最上位層と提供されているその他のライブラリの完全な一覧については、Databricks Runtime ML のリリースノートを参照してください。

次のステップ

作業を開始するには、次のトピックをご覧ください。

チュートリアル: ML を開始する

Databricks Machine Learning の推奨 MLOps ワークフローについては、次を参照してください。

Azure Databricks での MLOps ワークフロー

Databricks Machine Learning の主な機能については、次を参照してください。

次の方法で共有

Databricks での AI と Machine Learning

機械学習とディープラーニングに Databricks を使用する理由

Databricks でのディープラーニング

Databricks での大規模言語モデル (LLM) と生成 AI

Databricks Runtime for Machine Learning

Databricks Runtime ML を使用してクラスターを作成する

Photon と Databricks Runtime ML

Databricks Runtime ML に含まれているライブラリ

次のステップ

フィードバック

フィードバック

その他のリソース

次の方法で共有

Databricks での AI と Machine Learning

機械学習とディープ ラーニングに Databricks を使用する理由

Databricks でのディープ ラーニング

Databricks での大規模言語モデル (LLM) と生成 AI

Databricks Runtime for Machine Learning

Databricks Runtime ML を使用してクラスターを作成する

Photon と Databricks Runtime ML

Databricks Runtime ML に含まれているライブラリ

次のステップ

フィードバック

フィードバック

その他のリソース

機械学習とディープラーニングに Databricks を使用する理由

Databricks でのディープラーニング