モデルの再トレーニング

2024-04-20

ML.NET で機械学習モデルを再トレーニングする方法について説明します。

世界とそのデータは絶えず変化しています。そのため、モデルも同様に変更および更新する必要があります。 ML.NET には、学習したモデルのパラメーターを出発点として使用してモデルを再トレーニングする機能が用意されており、毎回最初から始めるのではなく、以前のエクスペリエンスを継続的に利用できます。

ML.NET では以下のアルゴリズムを再トレーニングできます。

事前トレーニング済みモデルを読み込む

まず、事前トレーニング済みモデルをアプリケーションに読み込みます。トレーニングパイプラインとモデルの読み込みの詳細については、「トレーニング済みモデルの保存と読み込み」を参照してください。

// Create MLContext
MLContext mlContext = new MLContext();

// Define DataViewSchema of data prep pipeline and trained model
DataViewSchema dataPrepPipelineSchema, modelSchema;

// Load data preparation pipeline
ITransformer dataPrepPipeline = mlContext.Model.Load("data_preparation_pipeline.zip", out dataPrepPipelineSchema);

// Load trained model
ITransformer trainedModel = mlContext.Model.Load("ogd_model.zip", out modelSchema);

事前トレーニング済みモデルのパラメーターを抽出する

モデルが読み込まれたら、事前トレーニング済みモデルの Model プロパティにアクセスして、学習済みモデルのパラメーターを抽出します。事前トレーニング済みモデルは、LinearRegressionModelParameters を出力する RegressionPredictionTransformer を作成する線形回帰モデル OnlineGradientDescentTrainer を使用して学習されています。これらのモデルのパラメーターには、学習済みのバイアスと、モデルの重みまたは係数が含まれています。これらの値は、新しい再トレーニング済みモデルの出発点として使用されます。

// Extract trained model parameters
LinearRegressionModelParameters originalModelParameters =
    ((ISingleFeaturePredictionTransformer<object>)trainedModel).Model as LinearRegressionModelParameters;

Note

モデルパラメーターの出力は、使用されるアルゴリズムによって異なります。たとえば、OnlineGradientDescentTrainer では LinearRegressionModelParameters が使用されますが、LbfgsMaximumEntropyMulticlassTrainer では MaximumEntropyModelParameters が出力されます。モデルパラメーターを抽出するとき、適切な型にキャストします。