MLflow モデルのログ記録、読み込み、登録

2025-06-10

MLflow モデルは、Apache Spark でのバッチ推論や、REST API を介したリアルタイムのサービスなどのさまざまなダウンストリームツールで使用できる機械学習モデルをパッケージ化するための標準形式です。この形式では、さまざまなフレーバー (python 関数、pytorch、sklearn など) でモデルを保存できる規則が定義されています。これは、さまざまなモデルサービングと推論プラットフォームで解釈できます。

ストリーミングモデルのログ記録とスコア付けの方法については、ストリーミングモデルの保存と読み込みに関する説明をご覧ください。

MLflow 3 では、メトリックやパラメーターなどの独自のメタデータを持つ新しい専用 LoggedModel オブジェクトを導入することで、MLflow モデルに大幅な機能強化が導入されています。詳細については、「 MLflow ログに記録されたモデルを使用してモデルを追跡および比較する」を参照してください。

モデルのログ記録と読み込み

モデルをログに記録すると、MLflow によって自動的に requirements.txt と conda.yaml の各ファイルがログに記録されます。これらのファイルを使用して、モデルの開発環境を再作成し、virtualenv (推奨) または conda を使用して依存関係を再インストールできます。

重要

Anaconda Inc. は、anaconda.org チャネルのサービス利用規約を更新しました。 Anaconda のパッケージ化と配布に依存している場合は、新しいサービス利用規約に基づいて商用ライセンスが必要になる場合があります。詳細については、「Anaconda Commercial Edition の FAQ」を参照してください。 Anaconda チャネルの使用には、同社のサービス使用条件が適用されます。

v1.18 (Databricks Runtime 8.3 ML 以前) より前にログに記録された MLflow モデルは既定で、conda defaults チャネル (https://repo.anaconda.com/pkgs/) を依存関係としてログに記録されていました。このライセンスの変更により、Databricks は MLflow v1.18 以降を使用してログに記録されたモデルの defaults チャネルの使用を停止しました。ログに記録された既定のチャネルは現在、conda-forge であり、これはコミュニティで管理されている https://conda-forge.org/ を指しています。

モデルの conda 環境から defaults チャネルを除外せずに MLflow v1.18 より前にモデルをログに記録した場合、そのモデルは意図していない defaults チャネルに依存している可能性があります。モデルにこの依存関係があるかどうかを手動で確認するには、ログに記録されたモデルと共にパッケージ化された channel ファイル内での conda.yaml 値を調べることができます。たとえば、conda.yaml チャネルの依存関係を持つモデルのdefaultsは次のようになります。

channels:
- defaults
dependencies:
- python=3.8.8
- pip
- pip:
    - mlflow
    - scikit-learn==0.23.2
    - cloudpickle==1.6.0
      name: mlflow-env

Databricks では、Anaconda リポジトリを使用してモデルを操作することが、Anaconda との関係の下で許可されているかどうか判断できないため、Databricks のお客様に変更を強制していません。 Databricks の使用による Anaconda.com リポジトリの使用が Anaconda の条件で許可されている場合は、何も行う必要はありません。

モデルの環境で使用されるチャネルを変更する場合は、新しい conda.yamlを使用してモデルをモデルレジストリに再登録できます。これを行うには、conda_env の log_model() パラメーターでチャネルを指定します。

log_model() API の詳細については、使用しているモデルフレーバー (scikit-learn の log_model など) の MLflow ドキュメントを参照してください。

conda.yaml ファイルの詳細については、MLflow のドキュメントを参照してください。

API コマンド

モデルを MLflow 追跡サーバーにログ記録するには、mlflow.<model-type>.log_model(model, ...) を使用します。

推論またはさらなる開発のために以前ログに記録されたモデルを読み込むには、mlflow.<model-type>.load_model(modelpath) を使用します。ここで modelpath は、次のいずれかです。

モデルパス ( models:/{model_id} など) (MLflow 3 のみ)
実行相対パス (例: runs:/{run_id}/{model-path})
Unity カタログボリュームパス ( dbfs:/Volumes/catalog_name/schema_name/volume_name/{path_to_artifact_root}/{model_path} など)
で始まる MLflow で管理されるアーティファクトストレージパス dbfs:/databricks/mlflow-tracking/
登録済みモデルパス (例: models:/{model_name}/{model_stage})。

MLflow モデルを読み込むオプションの完全な一覧については、MLflow ドキュメントの「成果物の参照」を参照してください。

Python MLflow モデルの場合、Python 汎用関数としてモデルを読み込むために mlflow.pyfunc.load_model() を使用することもできます。

次のコードスニペットを使用して、モデルを読み込み、データポイントをスコア付けできます。

model = mlflow.pyfunc.load_model(model_path)
model.predict(model_input)

別の方法として、モデルを Apache Spark UDF としてエクスポートし、バッチジョブまたはリアルタイム Spark ストリーミングジョブのいずれかとして Spark クラスターでのスコアリングに使用できます。

# load input data table as a Spark DataFrame
input_data = spark.table(input_table_name)
model_udf = mlflow.pyfunc.spark_udf(spark, model_path)
df = input_data.withColumn("prediction", model_udf())

ログモデルの依存関係

モデルを正確に読み込むには、モデルの依存関係が正しいバージョンでノートブック環境に読み込まれていることを確認する必要があります。 Databricks Runtime 10.5 ML 以降では、現在の環境とモデルの依存関係の間で不一致が検出された場合、MLflow によって警告が表示されます。

モデルの依存関係の復元を簡素化するための追加機能は、Databricks Runtime 11.0 ML 以上に含まれています。 Databricks Runtime 11.0 ML 以上では、pyfunc フレーバーモデルの場合、mlflow.pyfunc.get_model_dependencies を呼び出してモデルの依存関係を取得およびダウンロードできます。この関数は、依存関係ファイルへのパスを返します。これは %pip install <file-path> を使用してインストールできます。 PySpark UDF としてモデルを読み込む場合は、env_manager="virtualenv" 呼び出しで mlflow.pyfunc.spark_udf を指定します。これにより、PySpark UDF のコンテキストでモデルの依存関係が復元されます。外部環境には影響しません。

MLflow バージョン 1.25.0 以上を手動でインストールすることで、Databricks Runtime 10.5 以下でもこの機能を使用できます。

%pip install "mlflow>=1.25.0"

モデルの依存関係 (Python と Python 以外) と成果物をログに記録する方法の詳細については、「モデルの依存関係をログに記録する」を参照してください。

モデルの依存関係とモデル提供のためのカスタム成果物をログに記録する方法については、以下を参照してください。

MLflow UI で自動的に生成されたコードスニペット

Azure Databricks ノートブックでモデルをログに記録すると、Azure Databricks は自動的にコードスニペットを生成します。このスニペットをコピーして使用することで、モデルを読み込み実行できます。これらのコードスニペットを表示するには以下を実行します。

モデルを生成した実行の [実行] 画面に移動します。 ([実行] 画面を表示する方法については、「ノートブックの実験を表示する」を参照してください。)
[成果物] セクションまでスクロールします。
ログに記録されたモデルの名前をクリックします。右側にパネルが開き、ログに記録されたモデルを読み込んだり、Spark または pandas DataFrames で予測を行うコードが表示されます。

成果物パネルコードスニペット

例

ログモデルの例については、「機械学習トレーニングの実行を追跡する例」の例を参照してください。

モデルレジストリにモデルを登録する

MLflow モデルレジストリにモデルを登録できます。MLflow モデルレジストリは、MLflow モデルのライフサイクル全体を管理するための UI と API のセットを提供する一元化されたモデルストアです。 Databricks Unity Catalog でモデルレジストリを使用してモデルを管理する方法の手順については、「Unity Catalog 内でモデルライフサイクルを管理する」を参照してください。ワークスペースモデルレジストリを使用するには、「ワークスペースモデルレジストリを使用してモデルのライフサイクルを管理する」を参照してください。

MLflow 3 で作成されたモデルが Unity カタログモデルレジストリに登録されている場合は、すべての実験とワークスペースで、1 つの中央の場所でパラメーターやメトリックなどのデータを表示できます。詳細については、 MLflow 3 でのモデルレジストリの機能強化に関する説明を参照してください。

API を使用してモデルを登録するには、次のコマンドを使用します。

MLflow 3

mlflow.register_model("models:/{model_id}", "{registered_model_name}")

MLflow 2.x

mlflow.register_model("runs:/{run_id}/{model-path}", "{registered-model-name}")

モデルを Unity カタログボリュームに保存する

モデルをローカルに保存するには、mlflow.<model-type>.save_model(model, modelpath) を使用します。 modelpath は、 Unity カタログボリュームパスである必要があります。たとえば、プロジェクトの作業を格納 dbfs:/Volumes/catalog_name/schema_name/volume_name/my_project_models Unity カタログボリュームの場所を使用する場合は、モデルパス /dbfs/Volumes/catalog_name/schema_name/volume_name/my_project_modelsを使用する必要があります。

modelpath = "/dbfs/Volumes/catalog_name/schema_name/volume_name/my_project_models/model-%f-%f" % (alpha, l1_ratio)
mlflow.sklearn.save_model(lr, modelpath)

MLlib モデルの場合は、ML パイプラインを使用します。

モデル成果物をダウンロードする

さまざまな API を使用して、登録されたモデルのログに記録されたモデル成果物 (モデルファイル、プロット、メトリックなど) をダウンロードできます。

Python API の例:

mlflow.set_registry_uri("databricks-uc")
mlflow.artifacts.download_artifacts(f"models:/{model_name}/{model_version}")

Java API の例:

MlflowClient mlflowClient = new MlflowClient();
// Get the model URI for a registered model version.
String modelURI = mlflowClient.getModelVersionDownloadUri(modelName, modelVersion);

// Or download the model artifacts directly.
File modelFile = mlflowClient.downloadModelVersion(modelName, modelVersion);

CLI コマンドの例:

mlflow artifacts download --artifact-uri models:/<name>/<version|stage>

オンラインサービング用にモデルをデプロイする

手記

モデルをデプロイする前に、モデルが提供できることを確認することをお勧めします。 mlflow.models.predict を使用して、デプロイ前にモデルを検証する方法については、MLflow のドキュメントを参照してください。

Mosaic AI Model Serving を使用して、Unity Catalog モデルレジストリに REST エンドポイントとして登録された機械学習モデルをホストします。これらのエンドポイントは、モデルバージョンの可用性に基づいて自動的に更新されます。

次の方法で共有

MLflow モデルのログ記録、読み込み、登録

モデルのログ記録と読み込み

API コマンド

ログ モデルの依存関係

MLflow UI で自動的に生成されたコード スニペット

例

モデル レジストリにモデルを登録する

MLflow 3

MLflow 2.x

モデルを Unity カタログ ボリュームに保存する

モデル成果物をダウンロードする

オンライン サービング用にモデルをデプロイする

フィードバック

その他のリソース

ログモデルの依存関係

MLflow UI で自動的に生成されたコードスニペット

モデルレジストリにモデルを登録する

モデルを Unity カタログボリュームに保存する

オンラインサービング用にモデルをデプロイする