One-vs-All Multiclass

この記事では、Azure Machine Learning デザイナーで One-vs-All Multiclass コンポーネントを使用する方法について説明します。 目標は、one-versus-all アプローチを使って複数のクラスを予測できる分類モデルを作成することです。

このコンポーネントは、結果が連続またはカテゴリ予測変数に依存する場合に、考えられる 3 つ以上の結果を予測するモデルを作成する際に役立ちます。 また、この方法では、複数の出力クラスを必要とする問題に二項分類法を使用することもできます。

one-versus-all モデルの詳細

分類アルゴリズムには、3 つ以上のクラスの使用が仕様で許可されているものもあります。 考えられる結果を 2 つの値のいずれかに制限するもの (バイナリ (2 クラス) モデル) もあります。 ただし、二項分類アルゴリズムでも、さまざまな戦略を使用して多クラス分類タスクに適合させることができます。

このコンポーネントは、複数の出力クラスのそれぞれに対してバイナリ モデルが作成される one-versus-all 法を実装しています。 このコンポーネントでは、個々のクラスのこれらの各バイナリ モデルが、二項分類の問題と同様に、その補集合 (モデルの他のすべてのクラス) に対して評価されます。 その計算効率 (n_classes 分類子のみが必要) に加え、このアプローチの利点の 1 つに、解釈能力があります。 各クラスは、分類子別でのみ表されるため、対応する分類子を調べることによって、クラスに関する知識を得ることができます。 これは、多クラス分類で最も一般的に使用される方法であり、これは公正な既定の選択肢です。 次に、これらの二項分類子を実行し、信頼度スコアが最も高い予測を選択することで、予測が行われます。

このコンポーネントでは、実質的に、個々のモデルのアンサンブルが作成され、結果がマージされて、すべてのクラスを予測する単一のモデルが作成されます。 任意の二項分類子を one-versus-all モデルの基礎として使用できます。

たとえば、2 クラス サポート ベクター マシン モデルを構成し、それを One-vs-All Multiclass コンポーネントへの入力として提供するとします。 コンポーネントにより、出力クラスのすべてのメンバーに対して 2 クラス サポート ベクター マシン モデルが作成されます。 その後、one-versus-all 法を適用してすべてのクラスの結果が結合されます。

このコンポーネントでは sklearn の OneVsRestClassifier が使用されます。詳細については、こちらをご覧ください。

One-vs-All Multiclass 分類子を構成する方法

このコンポーネントでは、複数のクラスを分析するための二項分類モデルのアンサンブルが作成されます。 このコンポーネントを使用するには、まず "二項分類" モデルを構成してトレーニングする必要があります。

バイナリ モデルを One-vs-All Multiclass コンポーネントに接続します。 次に、ラベル付きトレーニング データセットに対してモデルのトレーニングを使用してモデルのアンサンブルをトレーニングします。

モデルを組み合わせると、One-vs-All Multiclass によって複数の二項分類モデルが作成され、クラスごとにアルゴリズムが最適化されて、モデルがマージされます。 このコンポーネントは、トレーニング データセットに複数のクラス値がある場合でも、これらのタスクを実行します。

  1. デザイナーで One-vs-All Multiclass コンポーネントを自分のパイプラインに追加します。 このコンポーネントは、 [Machine Learning] - [初期化][分類] カテゴリにあります。

    One-vs-All Multiclass 分類子には、独自の構成可能なパラメーターはありません。 カスタマイズは、入力として提供される二項分類モデルで行う必要があります。

  2. 二項分類モデルをパイプラインに追加し、そのモデルを構成します。 たとえば、2 クラス サポート ベクター マシンまたは 2 クラス ブースト デシジョン ツリーを使用できます。

  3. モデルのトレーニング コンポーネントを自分のパイプラインに追加します。 One-vs-All Multiclass の出力であるトレーニングされていない分類子を接続します。

  4. モデルのトレーニングのもう一方の入力で、複数のクラス値を含むラベル付きトレーニング データセットを接続します。

  5. パイプラインを送信します。

結果

トレーニングが完了したら、モデルを使用して多クラス予測を行うことができます。

または、トレーニングされていない分類子を Cross-Validate Model (モデルのクロス検証) に渡して、ラベル付き検証データセットに対するクロス検証を行うこともできます。

次のステップ

Azure Machine Learning で使用できる一連のコンポーネントを参照してください。