Share via


AutoML 分類

この記事では Azure Machine Learning デザイナーのコンポーネントについて説明します。

AutoML 分類に基づく機械学習モデルを作成するには、このコンポーネントを使用します。

構成方法

このコンポーネントは、表形式データに分類モデルを作成します。

このモデルにはトレーニング データセットが必要です。 検証およびテスト データセットは省略可能です。

AutoML は、モデルに対してさまざまなアルゴリズムとパラメーターを試行する多数のパイプラインを並列に作成します。 サービスは、機能選択と組み合わせた ML アルゴリズムを介して反復し、それぞれの反復で、トレーニング スコアを含むモデルを生成します。 モデルを最適化するメトリックを選択できます。 選択したメトリックのスコアが高いほど、モデルはデータに "適合している" と見なされます。 実験の終了基準を定義できます。 終了基準は、AutoML で検索する特定のトレーニング スコアを持つモデルになります。 定義されている終了基準に到達すると停止します。 その後、このコンポーネントは、データセットの実行の最後に生成された最適なモデルを出力します。

  1. AutoML 分類コンポーネントをパイプラインに追加します。

  2. モデルから出力する [ターゲット列] を指定します。

  3. [分類] については、ディープ ラーニングを有効にすることもできます。

ディープ ラーニングが有効になっている場合、検証は train_validation split に制限されます。

  1. (省略可能) 追加の構成設定の表示: トレーニング ジョブをより細かく制御するのに使用できる追加の設定です。 設定しない場合、実験の選択とデータに基づいて既定値が適用されます。

    追加の構成 説明
    主要メトリック モデルをスコアリングするために使用される主なメトリックです。 モデルのメトリックの詳細については、こちらを参照してください
    責任ある AI ダッシュボードを使用してモデルをデバッグする 推奨される最適なモデルについて包括的な評価とデバッグを行うために、責任ある AI ダッシュボードを生成します。 これには、モデルの説明、公平性とパフォーマンスのエクスプローラー、データ エクスプローラー、モデル エラー分析などの分析情報が含まれます。 責任ある AI ダッシュボードを生成する方法の詳細については、こちらを参照してください
    Blocked algorithm (ブロックするアルゴリズム) トレーニング ジョブから除外するアルゴリズムを選択します。

    許可するアルゴリズムは、SDK 実験でのみ使用できます。
    各タスクの種類でサポートされているアルゴリズムに関するページを参照してください。
    終了条件 これらの基準のどれかが満たされると、トレーニング ジョブが終了します。
    トレーニング ジョブ時間 (時間単位) :トレーニング ジョブを実行できる時間の長さ。
    メトリック スコアのしきい値: すべてのパイプラインの最小メトリック スコアです。 これにより、達成目標のターゲット メトリックを定義した場合には、必要以上にトレーニング ジョブに時間を費やすことはなくなります。
    コンカレンシー コンカレント イテレーションの最大数:トレーニング ジョブでテストするパイプライン (イテレーション) の最大数。 ジョブは、指定したイテレーションの数より多く実行されることはありません。 自動 ML によるクラスターでの複数の子ジョブの実行方法に関する詳細を説明します。
  2. [[Optional] Validate and test]([省略可能] 検証とテスト) フォームで、次の操作を行うことができます。

    1. トレーニング ジョブに使用する検証の種類を指定します。

    2. テスト データセット (プレビュー) を指定して、実験の最後に自動 ML によって生成される推奨モデルを評価します。 テスト データを指定すると、実験の最後にテスト ジョブが自動的にトリガーされます。 このテスト ジョブは、自動 ML によって推奨された最適なモデルでのみ実行されます。

      重要

      生成されたモデルを評価するためのテスト データセットの提供は、プレビュー機能です。 この機能は試験段階のプレビュー機能であり、随時変更される可能性があります。

      • テスト データは、推奨モデルのテスト ジョブの結果に偏りが出ないように、トレーニングと検証とは別のものと見なされます。 モデル検証中のバイアスの詳細について確認してください
      • 独自のテスト データセットを指定するか、トレーニング データセットの割合を使用することを選択できます。 テスト データは Azure Machine Learning TabularDataset 形式にする必要があります。
      • テスト データセットのスキーマは、トレーニング データセットと一致する必要があります。 ターゲット列は省略可能ですが、ターゲット列が示されていない場合、テスト メトリックは計算されません。
      • テスト データセットは、トレーニング データセットまたは検証データセットと同じにすべきではありません。

次のステップ

Azure Machine Learning で使用できる一連のコンポーネントを参照してください。