多クラス分類モデルを作成する
また、"マルチクラス" の分類モデルを作成することもでき、この場合は考えられるクラスが 2 つ以上あります。 たとえば、医療クリニックでは、糖尿病モデルを拡張して患者を次のように分類する場合があります。
- 非糖尿病
- 1 型糖尿病
- 2 型糖尿病
患者は必ず 3 つのクラスのうちのいずれかになるため、個々のクラスの確率値を加算すると、合計はやはり 1 になり、最も可能性の高いクラスがモデルによって予測されます。
多クラス分類モデルの使用
多クラス分類は、複数の二項分類の組み合わせと考えることができます。 この問題にアプローチするには、次の 2 つの方法があります。
- 1 対他 (OVR)。考えられる各クラス値に対して分類子が作成され、予測がこのクラスの場合は正の結果、予測がその他のクラスである場合は負の予測が生成されます。 たとえば、考えられる 4 つの図形クラス (正方形、円形、三角形、六角形) に関する分類の問題には、次の予測を行う 4 つの分類子が必要です。
- 正方形かどうか
- 円形かどうか
- 三角形かどうか
- 六角形かどうか
- 1 対 1 (OVO)。有効なクラスのペアごとに分類子が作成されます。 4 つの図形クラスの分類の問題には、次の二項分類子が必要です。
- 正方形または円
- 正方形または三角形
- 正方形または六角形
- 円形または三角形
- 円形または六角形
- 三角形または六角形
どちらのアプローチでも、モデル全体でこれらすべての予測が考慮されており、項目がどの単一カテゴリに属しているかを判断する必要があります。
さいわいなことに、Scikit-Learn を含むほとんどの機械学習フレームワークでは、マルチクラス分類モデルの実装は、二項分類と比較して大幅に複雑になるわけではありません。そしてほとんどの場合、二項分類に使用される推定器では、OVR アルゴリズムや OVO アルゴリズムを抽象化したり、いずれかを選べるようにしたりすることで、マルチクラス分類が暗黙的にサポートされます。