Vytvoření vícetřídových klasifikačních modelů
Je také možné vytvořit vícetřídové klasifikační modely, ve kterých je více než dvě možné třídy. Například zdravotní klinika může rozšířit model cukrovky, aby klasifikovala pacienty jako:
- Non-diabetic
- Diabetik typu 1
- Diabetik typu 2
Hodnoty pravděpodobnosti jednotlivých tříd by stále sečtily celkem 1, protože pacient je rozhodně v jedné ze tří tříd a nejpravděpodobnější třída by byla předpovězena modelem.
Použití klasifikačních modelů s více třídami
Vícetřídní klasifikaci lze považovat za kombinaci více binárních klasifikátorů. K problému přistupujete dvěma způsoby:
- Jeden vs Rest (OVR), ve kterém je klasifikátor vytvořen pro každou možnou hodnotu třídy, s pozitivním výsledkem pro případy, kdy je predikce tato třída, a negativní předpovědi pro případy, kdy je předpověď jakoukoli jinou třídou. Například klasifikační problém se čtyřmi možnými třídami obrazců (čtverec, kruh, trojúhelník, šestiúhelník) by vyžadoval čtyři klasifikátory, které predikovaly:
- čtverec nebo ne
- kruh nebo ne
- trojúhelník nebo ne
- šestiúhelník nebo ne
- Jeden vs One (OVO), ve kterém je vytvořen klasifikátor pro každou možnou dvojici tříd. Klasifikační problém se čtyřmi třídami obrazců by vyžadoval následující binární klasifikátory:
- čtvercový nebo kruh
- čtverec nebo trojúhelník
- čtverec nebo šestiúhelník
- kruh nebo trojúhelník
- kruh nebo šestiúhelník
- trojúhelník nebo šestiúhelník
V obou přístupech musí celkový model vzít v úvahu všechny tyto předpovědi, aby bylo možné určit, do které kategorie položka patří.
Ve většině architektur strojového učení, včetně Scikit-Learn, implementace klasifikačního modelu s více třídami není naštěstí složitější než binární klasifikace – a ve většině případů odhadátory používané pro binární klasifikaci implicitně podporují vícetřídovou klasifikaci abstrakcí algoritmu OVR, algoritmem OVO nebo povolením výběru.