MLflow における ML モデルのライフサイクル

2025-06-10

この記事では、Databricks 上の MLflow を使用して、高品質の生成 AI エージェントと機械学習モデルを開発する方法について説明します。

注

Azure Databricks の使用を開始したばかりの場合は、 Databricks Free Edition で MLflow を試すことを検討してください。

MLflow とは?

MLflow は、モデルと生成 AI アプリケーションを開発するためのオープンソースプラットフォームです。次の基本コンポーネントがあります。

追跡:実験を追跡し、パラメーターと結果を記録および比較します。
モデル: さまざまな ML ライブラリからさまざまなモデルサービスおよび推論プラットフォームにモデルを管理およびデプロイできます。
モデルレジストリ: モデルのバージョン管理と注釈機能を使用して、ステージングから運用環境へのモデルデプロイプロセスを管理できます。
AI エージェントの評価とトレース: エージェントの比較、評価、トラブルシューティングを支援することで、高品質の AI エージェントを開発できます。

MLflow は Java、Python、R、REST の各 API をサポートします。

MLflow 3

Azure Databricks の MLflow 3 は、Databricks Lakehouse 上の機械学習モデル、生成型 AI アプリケーション、エージェントに対して、最先端の実験追跡、可観測性、パフォーマンス評価を提供します。 Azure Databricks で MLflow 3 を使用すると、次のことができます。

開発ノートブック内の対話型クエリから運用バッチ、またはリアルタイムサービスデプロイまで、すべての環境でモデル、AI アプリケーション、エージェントのパフォーマンスを一元的に追跡および分析します。
Unity カタログを使用して評価とデプロイのワークフローを調整し、モデル、AI アプリケーション、またはエージェントの各バージョンの包括的な状態ログにアクセスします。
Unity カタログのモデルバージョンページと REST API から、モデルのメトリックとパラメーターを表示およびアクセスします。
すべての Gen AI アプリケーションとエージェントの要求と応答 (トレース) に注釈を付け、人間の専門家と自動化された手法 (LLM-as-a-judge など) が豊富なフィードバックを提供できるようにします。このフィードバックを利用して、アプリケーションバージョンのパフォーマンスを評価および比較し、品質を向上させるためにデータセットを構築できます。

これらの機能により、すべての AI イニシアチブの評価、デプロイ、デバッグ、監視が簡素化され、合理化されます。

MLflow 3 には、ログに記録されたモデルとデプロイジョブの概念も導入されています。

ログに記録されたモデルは、モデルのライフサイクル全体の進行状況を追跡するのに役立ちます。 log_model()を使用してモデルをログに記録すると、モデルのライフサイクル全体を通じて、さまざまな環境と実行にわたって保持されるLoggedModelが作成され、メタデータ、メトリック、パラメーター、モデルの生成に使用されるコードなどの成果物へのリンクが含まれます。ログに記録されたモデルを使用して、モデルを相互に比較し、最もパフォーマンスの高いモデルを見つけ、デバッグ中に情報を追跡できます。
デプロイジョブを使用して、評価、承認、デプロイなどの手順を含む、モデルのライフサイクルを管理できます。これらのモデルワークフローは Unity カタログによって管理され、すべてのイベントは Unity カタログのモデルバージョンページで使用可能なアクティビティログに保存されます。

MLflow 3 のインストールと使用の開始については、次の記事を参照してください。

Databricks マネージド MLflow

Databricks は、フルマネージドでホストされたバージョンの MLflow を提供し、オープンソースエクスペリエンスを基にして、エンタープライズでの使用に対してより堅牢でスケーラブルなものにします。

次の図は、Databricks と MLflow を統合して機械学習モデルをトレーニングおよびデプロイする方法を示しています。

MLflow は Databricks と統合され、ML ライフサイクルを管理します。

Databricks で管理される MLflow は、ML ライフサイクル内のすべてのデータと AI 資産を統合するために、Unity カタログと Cloud Data Lake 上に構築されています。

機能ストア: Databricks の自動機能検索により、統合が簡素化され、間違いが軽減されます。
モデルをトレーニングする: モザイク AI を使用してモデルをトレーニングしたり、基礎モデルを微調整したりします。
追跡: MLflow は、モデルのパフォーマンスを評価および比較するために、パラメーター、メトリック、成果物をログに記録することでトレーニングを追跡します。
モデルレジストリ: Unity カタログと統合された MLflow モデルレジストリにより、AI モデルとアーティファクトが一元化されます。
モデルの提供: Mosaic AI Model Serving は、REST API エンドポイントにモデルをデプロイします。
モニタリング： モザイク AI モデルサービスは、モデルを監視およびデバッグするための要求と応答を自動的にキャプチャします。 MLflow は、要求ごとにトレースデータを使用してこのデータを拡張します。

モデル訓練

MLflow モデルは、Databricks での AI および ML 開発の中核をなしています。 MLflow モデルは、機械学習モデルと生成 AI エージェントをパッケージ化するための標準化された形式です。標準化された形式により、Databricks のダウンストリームツールとワークフローでモデルとエージェントを使用できるようになります。

MLflow ドキュメント - モデル。

Databricks には、さまざまな種類の ML モデルのトレーニングに役立つ機能が用意されています。

モザイク AI を使用して AI モデルをトレーニングします。

実験の追跡

Databricks では、MLflow 実験を組織単位として使用して、モデルの開発中に作業を追跡します。

実験追跡を使用すると、機械学習のトレーニングとエージェントの開発中に、パラメーター、メトリック、成果物、およびコードバージョンをログに記録して管理できます。ログを実験と実行に整理することで、モデルの比較、パフォーマンスの分析、反復処理をより簡単に行うことができます。

Databricks を使用した実験の追跡。
実行と実験の追跡に関する一般的な情報については、MLflow のドキュメントを参照してください。

Unity カタログを使用したモデルレジストリ

MLflow モデルレジストリは、モデルデプロイプロセスを管理するための一元化されたモデルリポジトリ、UI、API のセットです。

Databricks は、モデルレジストリと Unity カタログを統合して、モデルの一元的なガバナンスを提供します。 Unity カタログ統合を使用すると、ワークスペース間でモデルにアクセスしたり、モデル系列を追跡したり、再利用のためにモデルを検出したりできます。

Databricks Unity カタログを使用してモデルを管理します。
モデルレジストリに関する一般的な情報については、MLflow のドキュメントを参照してください。

モデルの提供

Databricks Model Serving は、MLflow モデルレジストリと緊密に統合されており、AI モデルのデプロイ、管理、クエリを行う、統合されたスケーラブルなインターフェイスを提供します。サービスを提供する各モデルは、Web またはクライアントアプリケーションに統合できる REST API として使用できます。

これらは個別のコンポーネントですが、モデルサービスは MLflow モデルレジストリに大きく依存して、モデルのバージョン管理、依存関係の管理、検証、ガバナンスを処理します。

Databricks を使用したモデルサービス。

AI エージェントの開発と評価

AI エージェント開発の場合、Databricks は ML モデル開発と同様に MLflow と統合されます。ただし、いくつかの重要な違いがあります:

Databricks で AI エージェントを作成するには、MLflow に依存する Mosaic AI Agent Framework を使用して、エージェントコード、パフォーマンスメトリック、およびエージェントトレースを追跡します。
Databricks でエージェントを評価するには、MLflow に依存して評価結果を追跡するモザイク AI エージェント評価を使用します。
エージェントの MLflow 追跡には、MLflow トレースも含まれます。 MLflow トレースを使用すると、エージェントのサービスの実行に関する詳細情報を表示できます。トレースでは、要求の各中間ステップに関連付けられている入力、出力、およびメタデータが記録されるので、エージェントで予期しない動作の原因をすばやく見つけることができます。

次の図は、Databricks と MLflow を統合して AI エージェントを作成してデプロイする方法を示しています。

MLflow は Databricks と統合され、Gen AI アプリのライフサイクルを管理します。

Databricks で管理される MLflow は、Gen AI アプリライフサイクル内のすべてのデータと AI 資産を統合するために、Unity カタログと Cloud Data Lake 上に構築されています。

Vector > Feature Store: Databricks の自動ベクターおよび特徴検索により、統合が簡素化され、間違いが軽減されます。
AI エージェントの作成と評価: モザイク AI エージェントフレームワークとエージェント評価は、エージェントの作成と出力の評価に役立ちます。
追跡とトレース: MLflow トレースでは、生成 AI の可観測性を高めるための詳細なエージェント実行情報がキャプチャされます。
モデルレジストリ: Unity カタログと統合された MLflow モデルレジストリにより、AI モデルとアーティファクトが一元化されます。
モデルの提供: Mosaic AI Model Serving は、REST API エンドポイントにモデルをデプロイします。
モニタリング： MLflow は、モデルを監視およびデバッグするための要求と応答を自動的にキャプチャします。

オープンソースと Databricks で管理される MLflow 機能

オープンソースと Databricks で管理されるバージョン間で共有される一般的な MLflow の概念、API、および機能については、 MLflow のドキュメントを参照してください。 Databricks で管理される MLflow 専用の機能については、Databricks のドキュメントを参照してください。

次の表では、オープンソースの MLflow と Databricks で管理される MLflow の主な違いを示し、詳細情報に役立つドキュメントリンクを示します。

特徴	オープンソース MLflow での可用性	Databricks で管理される MLflow での可用性
安全	ユーザーは、独自のセキュリティガバナンスレイヤーを提供する必要があります	Databricks エンタープライズレベルのセキュリティ
障害復旧	利用不可	Databricks の障害復旧
実験の追跡	MLflow 追跡 API	Databricks の高度な実験追跡と統合された MLflow Tracking API
モデルレジストリ	MLflow モデルレジストリ	Databricks Unity カタログと統合された MLflow モデルレジストリ
Unity Catalog の統合	オープンソースと Unity カタログの統合	Databricks Unity カタログ
モデルデプロイ	外部サービスソリューション (SageMaker、Kubernetes、コンテナーサービスなど) とのユーザー構成の統合	Databricks モデルサービングと外部サービングソリューション
AI エージェント	MLflow LLM 開発	モザイク AI エージェントフレームワークとエージェント評価と統合された MLflow LLM 開発
暗号化	利用不可	カスタマーマネージドキーを使用した暗号化

次の方法で共有