モデルの評価と比較
自動機械学習 (AutoML) の実験が完了したら、トレーニングし終わったモデルを確認し、どれが最もパフォーマンスが優れていたかを判断する必要があります。
Azure Machine Learning スタジオで AutoML 実験を選択し、その詳細を調べることができます。
AutoML 実験の実行の [概要] ページで、入力データ資産と最適なモデルの概要を確認できます。 トレーニングし終わったすべてのモデルを調べるには、[モデル] タブを選択します。
前処理手順を確認する
AutoML 実験の特徴量化を有効にすると、データ ガードレールも自動的に適用されます。 分類モデルでサポートされている 3 つのデータ ガードレールは次のとおりです。
- クラス均衡の検出。
- 欠損特徴量値の補完。
- 高カーディナリティの特徴量の検出。
これらの各データ ガードレールには、可能性として 3 つの状態のいずれかが表示されます。
- 成功: データの問題は検出されませんでした。必要な操作はありません。
- 完了: データに変更が適用されました。 AutoML によってデータに加えられた変更を確認する必要があります。
- 通知済み: 問題が検出されましたが、解決できませんでした。 問題を解決するには、データを確認する必要があります。
AutoML では、データ ガードレールの横で、トレーニング済みの各モデルにスケーリングと正規化の手法を適用できます。 適用されている手法は、モデルの一覧の [アルゴリズム名] で確認できます。
たとえば、一覧に表示されているモデルのアルゴリズム名は MaxAbsScaler, LightGBM
のようになります。 MaxAbsScaler
は、各特徴量が最大絶対値でスケーリングされるスケーリング手法を指します。 LightGBM
は、モデルのトレーニングに使用される分類アルゴリズムを指します。
最適な実行とそのモデルを取得する
AutoML でモデルを確認しているときに、指定したプライマリ メトリックに基づいて最適な実行を簡単に特定できます。 Azure Machine Learning スタジオでは、モデルが自動的に並べ替えられて、最も優れたパフォーマンスのモデルが一番上に表示されます。
AutoML の実験の [モデル] タブで、同じ概要に他のメトリックを表示する場合は、列を編集できます。 さまざまなメトリックを含む、より包括的な概要を作成すると、モデルの比較が簡単になることがあります。
モデルをさらに詳しく調べるために、トレーニングし終わった各モデルの説明を生成できます。 AutoML 実験を構成するときに、最もパフォーマンスが優れたモデルの説明を生成する必要があることを指定できます。 ただし、別のモデルの解釈可能性に関心がある場合は、概要でモデルを選択し、[モデルの説明] を選択できます。
注意
モデルの説明は、モデルの解釈可能性の近似です。 具体的には、説明によって、対象の特徴量 (モデルが予測するようにトレーニングされたもの) に対する特徴の相対的な重要度が推定されます。 モデルの解釈可能性の詳細について学習する。
ヒント
AutoML 実行を評価する方法の詳細について学習する。